Filtrado de spam de próxima generación: ajuste fino comparativo de LLMs, NLPs y modelos CNN para la clasificación de spam por correo electrónico
Autores: Roumeliotis, Konstantinos I.; Tselikas, Nikolaos D.; Nasiopoulos, Dimitrios K.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Filtrado de spam de próxima generación: ajuste fino comparativo de LLMs, NLPs y modelos CNN para la clasificación de spam por correo electrónico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Correos no deseados
Ataques de phishing
Filtrado de correos electrónicos
Modelos de lenguaje
Modelos de PNL
Clasificación de spam
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 48
Citaciones: Sin citaciones
Los correos electrónicos no deseados y los ataques de phishing siguen representando desafíos significativos para los usuarios de correo electrónico en todo el mundo, lo que requiere técnicas avanzadas para su detección y clasificación eficientes. En este documento, abordamos los desafíos persistentes de los correos no deseados y los ataques de phishing al presentar un enfoque de vanguardia para el filtrado de correos electrónicos. Nuestra metodología se basa en aprovechar las capacidades de modelos de lenguaje avanzados, en particular el modelo de lenguaje grande GPT-4 (LLM), junto con los modelos de Procesamiento de Lenguaje Natural (NLP) BERT y RoBERTa de última generación. A través de un ajuste fino meticuloso adaptado para tareas de clasificación de spam, nuestro objetivo es superar las limitaciones de los sistemas tradicionales de detección de spam, como las Redes Neuronales Convolucionales (CNNs). A través de una extensa revisión de literatura, experimentación y evaluación, demostramos la efectividad de nuestro enfoque en identificar de manera precisa correos no deseados y de phishing mientras se minimizan los falsos positivos. Nuestra metodología destaca el potencial del ajuste fino de LLMs para tareas especializadas como la clasificación de spam, ofreciendo una protección mejorada contra los ataques de spam y phishing en constante evolución. Esta investigación contribuye al avance de las técnicas de filtrado de spam y sienta las bases para sistemas de seguridad de correo electrónico robustos ante amenazas cada vez más sofisticadas.
Descripción
Los correos electrónicos no deseados y los ataques de phishing siguen representando desafíos significativos para los usuarios de correo electrónico en todo el mundo, lo que requiere técnicas avanzadas para su detección y clasificación eficientes. En este documento, abordamos los desafíos persistentes de los correos no deseados y los ataques de phishing al presentar un enfoque de vanguardia para el filtrado de correos electrónicos. Nuestra metodología se basa en aprovechar las capacidades de modelos de lenguaje avanzados, en particular el modelo de lenguaje grande GPT-4 (LLM), junto con los modelos de Procesamiento de Lenguaje Natural (NLP) BERT y RoBERTa de última generación. A través de un ajuste fino meticuloso adaptado para tareas de clasificación de spam, nuestro objetivo es superar las limitaciones de los sistemas tradicionales de detección de spam, como las Redes Neuronales Convolucionales (CNNs). A través de una extensa revisión de literatura, experimentación y evaluación, demostramos la efectividad de nuestro enfoque en identificar de manera precisa correos no deseados y de phishing mientras se minimizan los falsos positivos. Nuestra metodología destaca el potencial del ajuste fino de LLMs para tareas especializadas como la clasificación de spam, ofreciendo una protección mejorada contra los ataques de spam y phishing en constante evolución. Esta investigación contribuye al avance de las técnicas de filtrado de spam y sienta las bases para sistemas de seguridad de correo electrónico robustos ante amenazas cada vez más sofisticadas.