Análisis, diseño y comparación de técnicas de aprendizaje automático para la detección de intrusiones en redes
Autores: Dini, Pierpaolo; Saponara, Sergio
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Análisis, diseño y comparación de técnicas de aprendizaje automático para la detección de intrusiones en redes
Categoría
Procesos industriales
Subcategoría
Diseño de procesos industriales
Palabras clave
Técnicas de aprendizaje automático
Detección de intrusiones
Sistemas en red
Clasificación de anomalías
Red de área local
Red neuronal artificial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
El uso de técnicas de aprendizaje automático se está volviendo cada vez más frecuente en la resolución de todos aquellos problemas donde es difícil interpretar racionalmente el proceso de interés. La detección de intrusiones en sistemas en red es un problema en el que, aunque no es fundamental interpretar las medidas que uno puede obtener de un proceso, es importante obtener una respuesta de un algoritmo de clasificación si el tráfico de la red se caracteriza por anomalías (y, por lo tanto, hay una alta probabilidad de una intrusión) o no. Debido a la mayor adopción de sistemas autónomos definidos por software que son distribuidos e interconectados, la probabilidad de un ciberataque ha aumentado, así como su consecuencia en términos de fiabilidad, disponibilidad e incluso seguridad del sistema. En este trabajo, presentamos la aplicación de diferentes modelos de aprendizaje automático al problema de clasificación de anomalías en el contexto del análisis del tráfico de redes de área local (LAN). En particular, presentamos la aplicación de un algoritmo de K-vecinos más cercanos (KNN) y de una red neuronal artificial (ANN) para realizar un algoritmo para sistemas de detección de intrusiones (IDS). El conjunto de datos utilizado en este trabajo es representativo del tráfico de comunicación en redes LAN comunes en aplicaciones militares, en particular, la típica LAN de la Fuerza Aérea de EE. UU. Este trabajo presenta una fase de entrenamiento de los diferentes modelos basada en un procedimiento de preprocesamiento de escalado multidimensional, basado en diferentes métricas, para proporcionar un mejor rendimiento y generalización con respecto a la capacidad de predicción del modelo. Los resultados obtenidos de los clasificadores KNN y ANN se comparan con respecto a un índice de rendimiento comúnmente utilizado para la evaluación de clasificadores.
Descripción
El uso de técnicas de aprendizaje automático se está volviendo cada vez más frecuente en la resolución de todos aquellos problemas donde es difícil interpretar racionalmente el proceso de interés. La detección de intrusiones en sistemas en red es un problema en el que, aunque no es fundamental interpretar las medidas que uno puede obtener de un proceso, es importante obtener una respuesta de un algoritmo de clasificación si el tráfico de la red se caracteriza por anomalías (y, por lo tanto, hay una alta probabilidad de una intrusión) o no. Debido a la mayor adopción de sistemas autónomos definidos por software que son distribuidos e interconectados, la probabilidad de un ciberataque ha aumentado, así como su consecuencia en términos de fiabilidad, disponibilidad e incluso seguridad del sistema. En este trabajo, presentamos la aplicación de diferentes modelos de aprendizaje automático al problema de clasificación de anomalías en el contexto del análisis del tráfico de redes de área local (LAN). En particular, presentamos la aplicación de un algoritmo de K-vecinos más cercanos (KNN) y de una red neuronal artificial (ANN) para realizar un algoritmo para sistemas de detección de intrusiones (IDS). El conjunto de datos utilizado en este trabajo es representativo del tráfico de comunicación en redes LAN comunes en aplicaciones militares, en particular, la típica LAN de la Fuerza Aérea de EE. UU. Este trabajo presenta una fase de entrenamiento de los diferentes modelos basada en un procedimiento de preprocesamiento de escalado multidimensional, basado en diferentes métricas, para proporcionar un mejor rendimiento y generalización con respecto a la capacidad de predicción del modelo. Los resultados obtenidos de los clasificadores KNN y ANN se comparan con respecto a un índice de rendimiento comúnmente utilizado para la evaluación de clasificadores.