Detección de mensajes de phishing en coreano utilizando análisis discriminante sesgado bajo un problema extremo de desequilibrio de clases
Autores: Kim, Siyoon; Park, Jeongmin; Ahn, Hyun; Lee, Yonggeol
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de mensajes de phishing en coreano utilizando análisis discriminante sesgado bajo un problema extremo de desequilibrio de clases
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Smartphones
Ataques de phishing en mensajería
Algoritmos de detección de phishing
Conjunto de datos de phishing en Corea
Problema de desequilibrio de clases
Análisis Discriminante Sesgado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En Corea del Sur, la rápida proliferación de teléfonos inteligentes ha llevado a un aumento en los ataques de phishing a través de mensajería asociados con estafas financieras de comunicación electrónica. En respuesta a esto, se han propuesto varios algoritmos de detección de phishing. Sin embargo, la recopilación de datos de phishing en mensajería presenta desafíos debido a las preocupaciones sobre su posible uso en actividades criminales. En consecuencia, un conjunto de datos de phishing coreano puede estar compuesto por datos desbalanceados, donde el número de mensajes generales podría superar al de los mensajes de phishing. Este problema de desbalance de clases y la escasez de datos pueden llevar a problemas de sobreajuste, dificultando la obtención de un alto rendimiento. Para resolver este problema, este artículo propone un método de clasificación de mensajes de phishing utilizando Análisis Discriminante Sesgado sin recurrir a técnicas de aumento de datos. En este artículo, al optimizar los parámetros para el ADS, logramos rendimientos excepcionalmente altos en el experimento de clasificación de mensajes de phishing, con un 95.45% de Recall y un 96.85% en la métrica BA. Además, al compararlo con otros algoritmos, el método propuesto demostró robustez contra el sobreajuste debido al problema de desbalance de clases y exhibió una disparidad mínima en el rendimiento entre los conjuntos de datos de entrenamiento y prueba.
Descripción
En Corea del Sur, la rápida proliferación de teléfonos inteligentes ha llevado a un aumento en los ataques de phishing a través de mensajería asociados con estafas financieras de comunicación electrónica. En respuesta a esto, se han propuesto varios algoritmos de detección de phishing. Sin embargo, la recopilación de datos de phishing en mensajería presenta desafíos debido a las preocupaciones sobre su posible uso en actividades criminales. En consecuencia, un conjunto de datos de phishing coreano puede estar compuesto por datos desbalanceados, donde el número de mensajes generales podría superar al de los mensajes de phishing. Este problema de desbalance de clases y la escasez de datos pueden llevar a problemas de sobreajuste, dificultando la obtención de un alto rendimiento. Para resolver este problema, este artículo propone un método de clasificación de mensajes de phishing utilizando Análisis Discriminante Sesgado sin recurrir a técnicas de aumento de datos. En este artículo, al optimizar los parámetros para el ADS, logramos rendimientos excepcionalmente altos en el experimento de clasificación de mensajes de phishing, con un 95.45% de Recall y un 96.85% en la métrica BA. Además, al compararlo con otros algoritmos, el método propuesto demostró robustez contra el sobreajuste debido al problema de desbalance de clases y exhibió una disparidad mínima en el rendimiento entre los conjuntos de datos de entrenamiento y prueba.