Un método de mejora en escenarios de pocas tomas para la detección de intrusiones en entornos de hogares inteligentes
Autores: Chen, Yajun; Wang, Junxiang; Yang, Tao; Li, Qinru; Nijhum, Nahian Alom
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método de mejora en escenarios de pocas tomas para la detección de intrusiones en entornos de hogares inteligentes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Dispositivos
Frecuencias de ataque
Modelos de detección de intrusiones
Método EM-FEDE
Mejora de datos
Hogares inteligentes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Los dispositivos en el entorno del hogar inteligente están sujetos a diferentes niveles de ataque. Los dispositivos con frecuencias de ataque más bajas enfrentan dificultades para recopilar datos de ataque, lo que restringe la capacidad de entrenar modelos de detección de intrusiones. Por lo tanto, este documento presenta un método novedoso llamado EM-FEDE (método de mejora basado en mejora de características y datos) para generar datos de entrenamiento adecuados para ampliar conjuntos de datos de pocos disparos. Entrenar modelos de detección de intrusiones con un conjunto de datos ampliado puede mejorar el rendimiento de detección. En primer lugar, el método EM-FEDE extiende de manera adaptativa las características analizando los registros históricos de detección de intrusiones de hogares inteligentes, logrando la alineación de formato de los datos de los dispositivos. En segundo lugar, el método EM-FEDE realiza operaciones de limpieza de datos para reducir el ruido y la redundancia y utiliza un mecanismo de muestreo aleatorio para garantizar la diversidad de los datos de pocos disparos obtenidos por muestreo. Finalmente, los datos de muestreo procesados se utilizan como entrada para el CWGAN, y se calcula la pérdida entre los datos generados y reales utilizando la distancia de Wasserstein. Basándose en esta pérdida, se ajusta el CWGAN. Finalmente, el generador produce datos generados de manera efectiva. Según los hallazgos experimentales, la precisión de J48, Random Forest, Bagging, PART, KStar, KNN, MLP y CNN se ha mejorado en un 21,9%, 6,2%, 19,4%, 9,2%, 6,3%, 7%, 3,4% y 5,9%, respectivamente, en comparación con el conjunto de datos original, junto con la proporción óptima de muestra de generación de cada algoritmo. Los hallazgos experimentales demuestran la efectividad del enfoque EM-FEDE en completar datos dispersos.
Descripción
Los dispositivos en el entorno del hogar inteligente están sujetos a diferentes niveles de ataque. Los dispositivos con frecuencias de ataque más bajas enfrentan dificultades para recopilar datos de ataque, lo que restringe la capacidad de entrenar modelos de detección de intrusiones. Por lo tanto, este documento presenta un método novedoso llamado EM-FEDE (método de mejora basado en mejora de características y datos) para generar datos de entrenamiento adecuados para ampliar conjuntos de datos de pocos disparos. Entrenar modelos de detección de intrusiones con un conjunto de datos ampliado puede mejorar el rendimiento de detección. En primer lugar, el método EM-FEDE extiende de manera adaptativa las características analizando los registros históricos de detección de intrusiones de hogares inteligentes, logrando la alineación de formato de los datos de los dispositivos. En segundo lugar, el método EM-FEDE realiza operaciones de limpieza de datos para reducir el ruido y la redundancia y utiliza un mecanismo de muestreo aleatorio para garantizar la diversidad de los datos de pocos disparos obtenidos por muestreo. Finalmente, los datos de muestreo procesados se utilizan como entrada para el CWGAN, y se calcula la pérdida entre los datos generados y reales utilizando la distancia de Wasserstein. Basándose en esta pérdida, se ajusta el CWGAN. Finalmente, el generador produce datos generados de manera efectiva. Según los hallazgos experimentales, la precisión de J48, Random Forest, Bagging, PART, KStar, KNN, MLP y CNN se ha mejorado en un 21,9%, 6,2%, 19,4%, 9,2%, 6,3%, 7%, 3,4% y 5,9%, respectivamente, en comparación con el conjunto de datos original, junto con la proporción óptima de muestra de generación de cada algoritmo. Los hallazgos experimentales demuestran la efectividad del enfoque EM-FEDE en completar datos dispersos.