logo móvil
Contáctanos

Detección de mensajes de phishing en coreano utilizando análisis discriminante sesgado bajo un problema extremo de desequilibrio de clases

Autores: Kim, Siyoon; Park, Jeongmin; Ahn, Hyun; Lee, Yonggeol

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Detección de mensajes de phishing en coreano utilizando análisis discriminante sesgado bajo un problema extremo de desequilibrio de clases


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Smartphones
Ataques de phishing en mensajería
Algoritmos de detección de phishing
Conjunto de datos de phishing en Corea
Problema de desequilibrio de clases
Análisis Discriminante Sesgado

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
En Corea del Sur, la rápida proliferación de teléfonos inteligentes ha llevado a un aumento en los ataques de phishing a través de mensajería asociados con estafas financieras de comunicación electrónica. En respuesta a esto, se han propuesto varios algoritmos de detección de phishing. Sin embargo, la recopilación de datos de phishing en mensajería presenta desafíos debido a las preocupaciones sobre su posible uso en actividades criminales. En consecuencia, un conjunto de datos de phishing coreano puede estar compuesto por datos desbalanceados, donde el número de mensajes generales podría superar al de los mensajes de phishing. Este problema de desbalance de clases y la escasez de datos pueden llevar a problemas de sobreajuste, dificultando la obtención de un alto rendimiento. Para resolver este problema, este artículo propone un método de clasificación de mensajes de phishing utilizando Análisis Discriminante Sesgado sin recurrir a técnicas de aumento de datos. En este artículo, al optimizar los parámetros para el ADS, logramos rendimientos excepcionalmente altos en el experimento de clasificación de mensajes de phishing, con un 95.45% de Recall y un 96.85% en la métrica BA. Además, al compararlo con otros algoritmos, el método propuesto demostró robustez contra el sobreajuste debido al problema de desbalance de clases y exhibió una disparidad mínima en el rendimiento entre los conjuntos de datos de entrenamiento y prueba.

Otros recursos que podrían interesarte

Temas Virtualpro