Detección de Spam en Aprendizaje Federado Basada en FedProx y Fusión Multi-Nivel Multi-Característica
Autores: Xiong, Yunpeng; Cao, Junkuo; Chen, Guolian
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Detección de Spam en Aprendizaje Federado Basada en FedProx y Fusión Multi-Nivel Multi-Característica
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección de spam tradicional
Aprendizaje federado
Riesgos de filtración de datos
Fusión de múltiples características
Preservación de la privacidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las metodologías tradicionales de detección de spam a menudo descuidan la preservación de la privacidad del usuario, lo que puede incurrir en riesgos de filtración de datos. Además, los modelos actuales de aprendizaje federado para la detección de spam enfrentan varios desafíos críticos: (1) heterogeneidad e inestabilidad de los datos durante la agregación de parámetros del lado del servidor, (2) inestabilidad en el entrenamiento de arquitecturas de redes neuronales únicas que conducen al colapso de modos, y (3) capacidad expresiva limitada en marcos de múltiples módulos debido a una complejidad excesiva. Estos problemas representan puntos críticos de investigación fundamentales en los sistemas de detección de spam basados en aprendizaje federado. Para abordar este desafío técnico, este estudio integra de manera innovadora marcos de aprendizaje federado con técnicas de fusión de múltiples características para proponer un nuevo modelo de detección de spam, FPW-BC. El modelo FPW-BC aborda el desequilibrio en la distribución de datos a través del algoritmo de agregación FedProx y mejora la estabilidad durante la agregación de parámetros del lado del servidor mediante una estrategia de selección de carreras de caballos. El modelo mitiga efectivamente las limitaciones inherentes tanto en arquitecturas de un solo módulo como en múltiples módulos a través de la fusión jerárquica de múltiples características. Para validar el rendimiento de FPW-BC, se realizaron experimentos exhaustivos en seis conjuntos de datos de referencia con características de distribución distintas: CEAS, Enron, Ling, Phishing_email, Spam_email y Fake_phishing, con un análisis comparativo contra múltiples métodos de referencia. Los resultados experimentales demuestran que FPW-BC logra una capacidad de generalización excepcional para varios patrones de spam mientras mantiene la preservación de la privacidad del usuario. El modelo alcanzó una precisión del 99.40% en CEAS y del 99.78% en Fake_phishing, representando mejoras significativas en la protección de la privacidad y la eficiencia de detección.
Descripción
Las metodologías tradicionales de detección de spam a menudo descuidan la preservación de la privacidad del usuario, lo que puede incurrir en riesgos de filtración de datos. Además, los modelos actuales de aprendizaje federado para la detección de spam enfrentan varios desafíos críticos: (1) heterogeneidad e inestabilidad de los datos durante la agregación de parámetros del lado del servidor, (2) inestabilidad en el entrenamiento de arquitecturas de redes neuronales únicas que conducen al colapso de modos, y (3) capacidad expresiva limitada en marcos de múltiples módulos debido a una complejidad excesiva. Estos problemas representan puntos críticos de investigación fundamentales en los sistemas de detección de spam basados en aprendizaje federado. Para abordar este desafío técnico, este estudio integra de manera innovadora marcos de aprendizaje federado con técnicas de fusión de múltiples características para proponer un nuevo modelo de detección de spam, FPW-BC. El modelo FPW-BC aborda el desequilibrio en la distribución de datos a través del algoritmo de agregación FedProx y mejora la estabilidad durante la agregación de parámetros del lado del servidor mediante una estrategia de selección de carreras de caballos. El modelo mitiga efectivamente las limitaciones inherentes tanto en arquitecturas de un solo módulo como en múltiples módulos a través de la fusión jerárquica de múltiples características. Para validar el rendimiento de FPW-BC, se realizaron experimentos exhaustivos en seis conjuntos de datos de referencia con características de distribución distintas: CEAS, Enron, Ling, Phishing_email, Spam_email y Fake_phishing, con un análisis comparativo contra múltiples métodos de referencia. Los resultados experimentales demuestran que FPW-BC logra una capacidad de generalización excepcional para varios patrones de spam mientras mantiene la preservación de la privacidad del usuario. El modelo alcanzó una precisión del 99.40% en CEAS y del 99.78% en Fake_phishing, representando mejoras significativas en la protección de la privacidad y la eficiencia de detección.