Marco basado en la simulación de flujos de mensajes del mundo real para evaluar soluciones de clasificación
Autores: Hojas-Mazo, Wenny; Maciá-Pérez, Francisco; Berná Martínez, José Vicente; Moreno-Espino, Mailyn; Lorenzo Fonseca, Iren; Pavón, Juan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Marco basado en la simulación de flujos de mensajes del mundo real para evaluar soluciones de clasificación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Corriente de mensajes
Evaluación
Soluciones de clasificación
Simulación
Marco
Mundo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Analizar flujos de mensajes en un entorno dinámico es un desafío. Se utilizan diversos métodos y métricas para evaluar soluciones de clasificación de mensajes, pero a menudo no logran simular de manera realista el entorno actual. Como resultado, la evaluación puede producir resultados excesivamente optimistas, lo que hace que las evaluaciones actuales de soluciones sean inadecuadas para entornos del mundo real. Este documento propone un marco basado en la simulación de flujos de mensajes del mundo real para evaluar soluciones de clasificación. El marco consta de cuatro módulos: simulación de flujos de mensajes, procesamiento, clasificación y evaluación. El módulo de simulación utiliza técnicas y teoría de colas para replicar un flujo de mensajes del mundo real. El módulo de procesamiento refina los mensajes de entrada para una clasificación óptima. El módulo de clasificación categoriza el flujo de mensajes generado utilizando soluciones existentes. El módulo de evaluación evalúa el rendimiento de las soluciones de clasificación midiendo la precisión, la exactitud y la recuperación. El marco puede modelar diferentes comportamientos de diferentes fuentes, como diferentes spammers con diferentes estrategias de ataque, medios de comunicación o fuentes de redes sociales. Cada perfil genera un flujo de mensajes que se combina en el flujo principal para mayor realismo. Se desarrolla un estudio de caso de detección de spam que demuestra la implementación del marco propuesto e identifica la latencia y la obfuscación del cuerpo del mensaje como parámetros críticos de calidad de clasificación.
Descripción
Analizar flujos de mensajes en un entorno dinámico es un desafío. Se utilizan diversos métodos y métricas para evaluar soluciones de clasificación de mensajes, pero a menudo no logran simular de manera realista el entorno actual. Como resultado, la evaluación puede producir resultados excesivamente optimistas, lo que hace que las evaluaciones actuales de soluciones sean inadecuadas para entornos del mundo real. Este documento propone un marco basado en la simulación de flujos de mensajes del mundo real para evaluar soluciones de clasificación. El marco consta de cuatro módulos: simulación de flujos de mensajes, procesamiento, clasificación y evaluación. El módulo de simulación utiliza técnicas y teoría de colas para replicar un flujo de mensajes del mundo real. El módulo de procesamiento refina los mensajes de entrada para una clasificación óptima. El módulo de clasificación categoriza el flujo de mensajes generado utilizando soluciones existentes. El módulo de evaluación evalúa el rendimiento de las soluciones de clasificación midiendo la precisión, la exactitud y la recuperación. El marco puede modelar diferentes comportamientos de diferentes fuentes, como diferentes spammers con diferentes estrategias de ataque, medios de comunicación o fuentes de redes sociales. Cada perfil genera un flujo de mensajes que se combina en el flujo principal para mayor realismo. Se desarrolla un estudio de caso de detección de spam que demuestra la implementación del marco propuesto e identifica la latencia y la obfuscación del cuerpo del mensaje como parámetros críticos de calidad de clasificación.