Algoritmo de agrupamiento disperso basado en autoencoder de reducción de dimensionalidad multi-dominio
Autores: Kang, Yu; Liu, Erwei; Zou, Kaichi; Wang, Xiuyun; Zhang, Huaqing
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Algoritmo de agrupamiento disperso basado en autoencoder de reducción de dimensionalidad multi-dominio
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Descubriendo
Estructuras intrínsecas
Patrones
Agrupamiento de alta dimensionalidad
Algoritmo de agrupamiento disperso
Modelo de reducción de dimensionalidad multi-dominio
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La clave para el clustering de alta dimensionalidad radica en descubrir las estructuras y patrones intrínsecos en los datos para proporcionar información valiosa. Sin embargo, el clustering de alta dimensionalidad enfrenta enormes desafíos como el desastre dimensional, el aumento de la dispersión de datos y la reducción de la fiabilidad de los resultados del clustering. Para abordar estos problemas, proponemos un algoritmo de clustering disperso basado en un modelo de reducción de dimensionalidad multi-dominio. Este método logra el clustering de alta dimensionalidad integrando el proceso de reconstrucción dispersa y la regularización L1 dispersa en un modelo de autoencoder profundo. Se diseña un módulo de reconstrucción dispersa basado en la reconstrucción dispersa L1 de características bajo diferentes dominios para reconstruir los datos. El método propuesto contribuye principalmente en dos aspectos. En primer lugar, se combinan los dominios espacial y de frecuencia teniendo en cuenta la distribución espacial y las características de frecuencia de los datos para proporcionar múltiples perspectivas y opciones para el análisis y procesamiento de datos. Luego, se realiza un modelo de clustering basado en redes neuronales con dispersión proyectando puntos de datos en multi-dominios e implementando términos de penalización de regularización adaptativa en la matriz de pesos. Los resultados experimentales demuestran un rendimiento superior del método propuesto en el manejo de problemas de clustering en conjuntos de datos de alta dimensionalidad.
Descripción
La clave para el clustering de alta dimensionalidad radica en descubrir las estructuras y patrones intrínsecos en los datos para proporcionar información valiosa. Sin embargo, el clustering de alta dimensionalidad enfrenta enormes desafíos como el desastre dimensional, el aumento de la dispersión de datos y la reducción de la fiabilidad de los resultados del clustering. Para abordar estos problemas, proponemos un algoritmo de clustering disperso basado en un modelo de reducción de dimensionalidad multi-dominio. Este método logra el clustering de alta dimensionalidad integrando el proceso de reconstrucción dispersa y la regularización L1 dispersa en un modelo de autoencoder profundo. Se diseña un módulo de reconstrucción dispersa basado en la reconstrucción dispersa L1 de características bajo diferentes dominios para reconstruir los datos. El método propuesto contribuye principalmente en dos aspectos. En primer lugar, se combinan los dominios espacial y de frecuencia teniendo en cuenta la distribución espacial y las características de frecuencia de los datos para proporcionar múltiples perspectivas y opciones para el análisis y procesamiento de datos. Luego, se realiza un modelo de clustering basado en redes neuronales con dispersión proyectando puntos de datos en multi-dominios e implementando términos de penalización de regularización adaptativa en la matriz de pesos. Los resultados experimentales demuestran un rendimiento superior del método propuesto en el manejo de problemas de clustering en conjuntos de datos de alta dimensionalidad.