Minería de patrones discriminativos de utilidad significativa en bases de datos cuantitativas
Autores: Tang, Huijun; Wang, Jufeng; Wang, Le
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Minería de patrones discriminativos de utilidad significativa en bases de datos cuantitativas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Patrón discriminativo
Conjuntos de datos cuantitativos
Patrón de alta utilidad
Algoritmo centrado en el usuario
Muestreo de patrones
HUPSampler
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Dibujar un patrón discriminativo en conjuntos de datos cuantitativos suele representarse para devolver un patrón de alta utilidad (HUP). Los métodos tradicionales producen patrones con una utilidad por encima de un umbral preestablecido. Sin embargo, el algoritmo actual centrado en el usuario requiere producir los resultados de manera oportuna para fortalecer la interacción entre el sistema de minería y los usuarios. El muestreo de patrones puede devolver resultados con una garantía de probabilidad en poco tiempo, y podría ser una tecnología candidata para minar dichos patrones discriminativos. En este documento, se propone un enfoque novedoso llamado HUPSampler para muestrear un HUP potencial, que se extrae con significancia de probabilidad según su utilidad en la base de datos. HUPSampler introduce una restricción de intervalo en la longitud de HUP y extrae aleatoriamente un entero según la proporción de utilidad en primer lugar; luego, los HUPs podrían obtenerse eficientemente de un árbol aleatorio utilizando un método de crecimiento de patrones, y finalmente, devuelve un HUP de longitud aleatoria. El estudio experimental muestra que HUPSampler es eficiente en cuanto al uso de memoria, tiempo de ejecución y distribución de utilidad. Además, los estudios de caso muestran que HUPSampler puede usarse significativamente en el análisis de la epidemia de COVID-19 identificando ubicaciones críticas.
Descripción
Dibujar un patrón discriminativo en conjuntos de datos cuantitativos suele representarse para devolver un patrón de alta utilidad (HUP). Los métodos tradicionales producen patrones con una utilidad por encima de un umbral preestablecido. Sin embargo, el algoritmo actual centrado en el usuario requiere producir los resultados de manera oportuna para fortalecer la interacción entre el sistema de minería y los usuarios. El muestreo de patrones puede devolver resultados con una garantía de probabilidad en poco tiempo, y podría ser una tecnología candidata para minar dichos patrones discriminativos. En este documento, se propone un enfoque novedoso llamado HUPSampler para muestrear un HUP potencial, que se extrae con significancia de probabilidad según su utilidad en la base de datos. HUPSampler introduce una restricción de intervalo en la longitud de HUP y extrae aleatoriamente un entero según la proporción de utilidad en primer lugar; luego, los HUPs podrían obtenerse eficientemente de un árbol aleatorio utilizando un método de crecimiento de patrones, y finalmente, devuelve un HUP de longitud aleatoria. El estudio experimental muestra que HUPSampler es eficiente en cuanto al uso de memoria, tiempo de ejecución y distribución de utilidad. Además, los estudios de caso muestran que HUPSampler puede usarse significativamente en el análisis de la epidemia de COVID-19 identificando ubicaciones críticas.