Detección de anomalías basada en aprendizaje automático utilizando matriz K-Mean y optimización secuencial mínima
Autores: Gadal, Saad; Mokhtar, Rania; Abdelhaq, Maha; Alsaqour, Raed; Ali, Elmustafa Sayed; Saeed, Rashid
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección de anomalías basada en aprendizaje automático utilizando matriz K-Mean y optimización secuencial mínima
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Inteligencia artificial
Minería de datos
Detección de anomalías
Aprendizaje automático
Técnica de ML
Intrusión en la red
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Recientemente, las técnicas de inteligencia artificial (IA) se han utilizado para describir las características de la información, ya que ayudan en el proceso de minería de datos (DM) para analizar datos y revelar reglas y patrones. En DM, la detección de anomalías es un área importante que ayuda a descubrir comportamientos ocultos dentro de los datos que son más vulnerables a los ataques. También ayuda a detectar intrusiones en la red. Algoritmos como el clúster híbrido K-mean y la optimización secuencial mínima (SMO) se pueden utilizar para mejorar la precisión de la tasa de detección de anomalías. Este documento presenta un modelo de detección de anomalías basado en la técnica de aprendizaje automático (ML). ML mejora la tasa de detección, reduce la tasa de falsas alarmas positivas y es capaz de mejorar la precisión de la clasificación de intrusiones. Este estudio utilizó un conjunto de datos conocido como laboratorio de descubrimiento de conocimiento y datos de seguridad de red (NSL-KDD) para evaluar una tecnología ML híbrida propuesta. Se utilizaron clúster K-mean y SMO para la clasificación. En el estudio, se probó el rendimiento de la detección de anomalías propuesta, y los resultados mostraron que el uso de K-mean y SMO mejora la tasa de detección positiva además de reducir la tasa de falsas alarmas y lograr una alta precisión al mismo tiempo. Además, el algoritmo propuesto superó el trabajo reciente y cercano relacionado con el uso de variables similares y el entorno en un 14,48% y disminuyó la probabilidad de falsas alarmas (FAP) en un 12%, además de ofrecer una mayor precisión del 97,4%. Estos resultados se atribuyen al algoritmo común que proporciona un número adecuado de detectores que se pueden generar con una detección precisa y una probabilidad de falsa alarma trivial (FAP) aceptable. El algoritmo híbrido propuesto podría considerarse para la detección de anomalías en futuros sistemas de minería de datos, donde es muy probable que el procesamiento en tiempo real se reduzca drásticamente. La justificación es que el algoritmo híbrido puede proporcionar un número adecuado de detectores que se pueden generar con una precisión de detección aceptable y una FAP trivial. Dado el bajo FAP, es muy probable que se reduzca el tiempo de preprocesamiento y procesamiento en comparación con otros algoritmos.
Descripción
Recientemente, las técnicas de inteligencia artificial (IA) se han utilizado para describir las características de la información, ya que ayudan en el proceso de minería de datos (DM) para analizar datos y revelar reglas y patrones. En DM, la detección de anomalías es un área importante que ayuda a descubrir comportamientos ocultos dentro de los datos que son más vulnerables a los ataques. También ayuda a detectar intrusiones en la red. Algoritmos como el clúster híbrido K-mean y la optimización secuencial mínima (SMO) se pueden utilizar para mejorar la precisión de la tasa de detección de anomalías. Este documento presenta un modelo de detección de anomalías basado en la técnica de aprendizaje automático (ML). ML mejora la tasa de detección, reduce la tasa de falsas alarmas positivas y es capaz de mejorar la precisión de la clasificación de intrusiones. Este estudio utilizó un conjunto de datos conocido como laboratorio de descubrimiento de conocimiento y datos de seguridad de red (NSL-KDD) para evaluar una tecnología ML híbrida propuesta. Se utilizaron clúster K-mean y SMO para la clasificación. En el estudio, se probó el rendimiento de la detección de anomalías propuesta, y los resultados mostraron que el uso de K-mean y SMO mejora la tasa de detección positiva además de reducir la tasa de falsas alarmas y lograr una alta precisión al mismo tiempo. Además, el algoritmo propuesto superó el trabajo reciente y cercano relacionado con el uso de variables similares y el entorno en un 14,48% y disminuyó la probabilidad de falsas alarmas (FAP) en un 12%, además de ofrecer una mayor precisión del 97,4%. Estos resultados se atribuyen al algoritmo común que proporciona un número adecuado de detectores que se pueden generar con una detección precisa y una probabilidad de falsa alarma trivial (FAP) aceptable. El algoritmo híbrido propuesto podría considerarse para la detección de anomalías en futuros sistemas de minería de datos, donde es muy probable que el procesamiento en tiempo real se reduzca drásticamente. La justificación es que el algoritmo híbrido puede proporcionar un número adecuado de detectores que se pueden generar con una precisión de detección aceptable y una FAP trivial. Dado el bajo FAP, es muy probable que se reduzca el tiempo de preprocesamiento y procesamiento en comparación con otros algoritmos.