Particionamiento Óptimo de Conjuntos de Datos Desequilibrados para la Detección de Anomalías en BGP
Autores: Verma, Rahul Deo; Keserwani, Pankaj Kumar; Jain, Vinesh Kumar; Govil, Mahesh Chandra; Maduranga, M. W. P.; Tilwari, Valmik
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Particionamiento Óptimo de Conjuntos de Datos Desequilibrados para la Detección de Anomalías en BGP
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Telecomunicaciones
Palabras clave
Internet
Detección de anomalías
Protocolo de puerta de enlace fronteriza
Máquina de aprendizaje extremo
Distribución de clases desbalanceada
Particionamiento óptimo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Internet juega un papel vital en el intercambio de información en la sociedad. Mantener la seguridad y robustez de la detección de anomalías en el tráfico del Protocolo de Puerta de Enlace Fronteriza (BGP) es muy importante para garantizar servicios de enrutamiento estables. Las soluciones existentes se basan en modelos clásicos de aprendizaje automático (ML), que necesitan ser avanzados. En este estudio, se utilizó una técnica revolucionaria que emplea la Máquina de Aprendizaje Extremo (ELM) para mejorar la detección de anomalías en el entorno dinámico del Protocolo de Puerta de Enlace Fronteriza (BGP), particularmente cuando se enfrenta a distribuciones de clases altamente desbalanceadas. La combinación de la distribución de clases desbalanceada y la naturaleza dinámica del BGP a menudo conduce al rendimiento subóptimo de los clasificadores. Nuestra solución propuesta tiene como objetivo abordar este problema de desbalance al dividir las clases dominantes en múltiples subclases. Esta división se logra a través de la partición óptima (OP), que implica segmentar las muestras de la clase mayoritaria en diferentes segmentos para aproximar el tamaño de la clase minoritaria. Como resultado, se crean clases diversificadas para entrenar el clasificador ELM. Para evaluar la efectividad del modelo propuesto (OP-ELM), se utilizaron los conjuntos de datos RIPE y BCNET. Estos archivos de trazas fueron procesados utilizando MATLAB para extraer y organizar las características necesarias, generando así conjuntos de datos adecuados para el análisis, que se denominan Conjunto de Datos-1 y Conjunto de Datos-2. Los hallazgos experimentales exhiben mejoras notables en el rendimiento en comparación con metodologías anteriores, destacando así la eficacia de nuestro enfoque innovador para abordar los obstáculos asociados con la detección de anomalías en redes BGP.
Descripción
Internet juega un papel vital en el intercambio de información en la sociedad. Mantener la seguridad y robustez de la detección de anomalías en el tráfico del Protocolo de Puerta de Enlace Fronteriza (BGP) es muy importante para garantizar servicios de enrutamiento estables. Las soluciones existentes se basan en modelos clásicos de aprendizaje automático (ML), que necesitan ser avanzados. En este estudio, se utilizó una técnica revolucionaria que emplea la Máquina de Aprendizaje Extremo (ELM) para mejorar la detección de anomalías en el entorno dinámico del Protocolo de Puerta de Enlace Fronteriza (BGP), particularmente cuando se enfrenta a distribuciones de clases altamente desbalanceadas. La combinación de la distribución de clases desbalanceada y la naturaleza dinámica del BGP a menudo conduce al rendimiento subóptimo de los clasificadores. Nuestra solución propuesta tiene como objetivo abordar este problema de desbalance al dividir las clases dominantes en múltiples subclases. Esta división se logra a través de la partición óptima (OP), que implica segmentar las muestras de la clase mayoritaria en diferentes segmentos para aproximar el tamaño de la clase minoritaria. Como resultado, se crean clases diversificadas para entrenar el clasificador ELM. Para evaluar la efectividad del modelo propuesto (OP-ELM), se utilizaron los conjuntos de datos RIPE y BCNET. Estos archivos de trazas fueron procesados utilizando MATLAB para extraer y organizar las características necesarias, generando así conjuntos de datos adecuados para el análisis, que se denominan Conjunto de Datos-1 y Conjunto de Datos-2. Los hallazgos experimentales exhiben mejoras notables en el rendimiento en comparación con metodologías anteriores, destacando así la eficacia de nuestro enfoque innovador para abordar los obstáculos asociados con la detección de anomalías en redes BGP.