Validación de conjunto de datos de IoT utilizando técnicas de aprendizaje automático para la detección de anomalías de tráfico
Autores: Vigoya, Laura; Fernandez, Diego; Carneiro, Victor; Nóvoa, Francisco J.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Validación de conjunto de datos de IoT utilizando técnicas de aprendizaje automático para la detección de anomalías de tráfico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avances
Sistemas inteligentes
Tráfico de red IoT
Vulnerabilidades de seguridad
Aprendizaje automático
Conjunto de datos DAD
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Con los avances en ingeniería y ciencia, la aplicación de sistemas inteligentes está aumentando, generando un crecimiento más rápido del tráfico de red del IoT. Las limitaciones debido a los dispositivos de alimentación y cómputo restringidos del IoT también plantean preocupaciones sobre vulnerabilidades de seguridad. Las técnicas basadas en aprendizaje automático han ganado recientemente credibilidad en una aplicación exitosa para la detección de anomalías de red, incluidas las redes del IoT. Sin embargo, las técnicas de aprendizaje automático no pueden funcionar sin datos representativos. Dada la escasez de conjuntos de datos del IoT, el DAD surgió como un instrumento para conocer el comportamiento de las redes dedicadas del IoT-MQTT. Este documento tiene como objetivo validar el conjunto de datos DAD aplicando Regresión Logística, Naive Bayes, Random Forest, AdaBoost y Máquina de Vectores de Soporte para detectar anomalías de tráfico en IoT. Para obtener los mejores resultados, se han utilizado técnicas para manejar datos desequilibrados, selección de características y búsqueda de cuadrícula para optimización de hiperparámetros. Los resultados experimentales muestran que el conjunto de datos propuesto puede lograr una alta tasa de detección en todos los experimentos, proporcionando la mejor precisión media de 0.99 para los modelos basados en árboles, con una baja tasa de falsos positivos, asegurando una detección efectiva de anomalías.
Descripción
Con los avances en ingeniería y ciencia, la aplicación de sistemas inteligentes está aumentando, generando un crecimiento más rápido del tráfico de red del IoT. Las limitaciones debido a los dispositivos de alimentación y cómputo restringidos del IoT también plantean preocupaciones sobre vulnerabilidades de seguridad. Las técnicas basadas en aprendizaje automático han ganado recientemente credibilidad en una aplicación exitosa para la detección de anomalías de red, incluidas las redes del IoT. Sin embargo, las técnicas de aprendizaje automático no pueden funcionar sin datos representativos. Dada la escasez de conjuntos de datos del IoT, el DAD surgió como un instrumento para conocer el comportamiento de las redes dedicadas del IoT-MQTT. Este documento tiene como objetivo validar el conjunto de datos DAD aplicando Regresión Logística, Naive Bayes, Random Forest, AdaBoost y Máquina de Vectores de Soporte para detectar anomalías de tráfico en IoT. Para obtener los mejores resultados, se han utilizado técnicas para manejar datos desequilibrados, selección de características y búsqueda de cuadrícula para optimización de hiperparámetros. Los resultados experimentales muestran que el conjunto de datos propuesto puede lograr una alta tasa de detección en todos los experimentos, proporcionando la mejor precisión media de 0.99 para los modelos basados en árboles, con una baja tasa de falsos positivos, asegurando una detección efectiva de anomalías.