Motor de Generación de Datos Basado en Algoritmos (ADG) para Análisis de Datos Comportamentales de Usuarios en Modo Dual
Autores: Sulayman, Iman I. M. Abu; Voege, Peter; Ouda, Abdelkader
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Motor de Generación de Datos Basado en Algoritmos (ADG) para Análisis de Datos Comportamentales de Usuarios en Modo Dual
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Análisis de datos
Generación de datos sintéticos
Motor de generación de datos basado en algoritmos (ADG)
Comportamiento anómalo
Porcentajes de anomalías
Algoritmos centrales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La creciente importancia del análisis de datos en el análisis de información moderno se basa en grandes cantidades de datos de usuarios. Sin embargo, solo es factible acumular suficientes datos para diversas tareas en contextos específicos de recopilación de datos que tienen información de seguridad limitada o están asociados con aplicaciones más antiguas. Existen numerosos escenarios donde un dominio es demasiado nuevo, demasiado especializado, demasiado seguro o los datos están demasiado escasamente disponibles para apoyar adecuadamente los esfuerzos de análisis de datos. En tales casos, la generación de datos sintéticos se vuelve necesaria para facilitar un análisis adicional. Para abordar este desafío, hemos desarrollado un Motor de Generación de Datos Basado en Algoritmos (ADG) que permite la generación de datos sin necesidad de datos iniciales, basándose en patrones de comportamiento del usuario, incluyendo tanto comportamientos normales como anormales. El Motor ADG utiliza un sistema de base de datos estructurado para hacer un seguimiento de los usuarios a través de diferentes tipos de actividad. Luego utiliza toda esta información para hacer que los datos generados sean lo más reales posible. Nuestros esfuerzos se centran particularmente en el análisis de datos, logrado mediante la generación de anormalidades dentro de los datos y permitiendo a los usuarios personalizar la generación de proporciones de datos normales y anormales. En situaciones donde obtener datos adicionales a través de medios convencionales sería impráctico o imposible, especialmente en el caso de características específicas como los porcentajes de anomalías, los conjuntos de datos generados algorítmicamente proporcionan una alternativa viable. En este documento, presentamos el Motor ADG, que puede crear conjuntos de datos coherentes para múltiples usuarios involucrados en diferentes actividades y en varias plataformas, completamente desde cero. El Motor ADG incorpora proporciones normales y anormales dentro de cada plataforma de datos a través de la aplicación de algoritmos fundamentales para la generación de anomalías basadas en el tiempo y en números. El porcentaje anormal resultante se compara con los valores esperados y varía de 0.13 a 0.17 instancias de datos anormales en cada columna. Junto con la proporción normal/anormal, los resultados sugieren fuertemente que el Motor ADG ha completado con éxito su tarea principal.
Descripción
La creciente importancia del análisis de datos en el análisis de información moderno se basa en grandes cantidades de datos de usuarios. Sin embargo, solo es factible acumular suficientes datos para diversas tareas en contextos específicos de recopilación de datos que tienen información de seguridad limitada o están asociados con aplicaciones más antiguas. Existen numerosos escenarios donde un dominio es demasiado nuevo, demasiado especializado, demasiado seguro o los datos están demasiado escasamente disponibles para apoyar adecuadamente los esfuerzos de análisis de datos. En tales casos, la generación de datos sintéticos se vuelve necesaria para facilitar un análisis adicional. Para abordar este desafío, hemos desarrollado un Motor de Generación de Datos Basado en Algoritmos (ADG) que permite la generación de datos sin necesidad de datos iniciales, basándose en patrones de comportamiento del usuario, incluyendo tanto comportamientos normales como anormales. El Motor ADG utiliza un sistema de base de datos estructurado para hacer un seguimiento de los usuarios a través de diferentes tipos de actividad. Luego utiliza toda esta información para hacer que los datos generados sean lo más reales posible. Nuestros esfuerzos se centran particularmente en el análisis de datos, logrado mediante la generación de anormalidades dentro de los datos y permitiendo a los usuarios personalizar la generación de proporciones de datos normales y anormales. En situaciones donde obtener datos adicionales a través de medios convencionales sería impráctico o imposible, especialmente en el caso de características específicas como los porcentajes de anomalías, los conjuntos de datos generados algorítmicamente proporcionan una alternativa viable. En este documento, presentamos el Motor ADG, que puede crear conjuntos de datos coherentes para múltiples usuarios involucrados en diferentes actividades y en varias plataformas, completamente desde cero. El Motor ADG incorpora proporciones normales y anormales dentro de cada plataforma de datos a través de la aplicación de algoritmos fundamentales para la generación de anomalías basadas en el tiempo y en números. El porcentaje anormal resultante se compara con los valores esperados y varía de 0.13 a 0.17 instancias de datos anormales en cada columna. Junto con la proporción normal/anormal, los resultados sugieren fuertemente que el Motor ADG ha completado con éxito su tarea principal.