Análisis exploratorio de datos y búsqueda de cliques en grafos
Autores: Hubai, András; Szabó, Sándor; Zaválnij, Bogdán
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Análisis exploratorio de datos y búsqueda de cliques en grafos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Análisis de componentes principales
Conjunto de datos
De baja dimensionalidad
Variedad lineal
Subconjuntos
1-dimensional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
El análisis de componentes principales es una técnica bien conocida y ampliamente utilizada para determinar la dimensión esencial de un conjunto de datos. En términos generales, su objetivo es encontrar una variedad lineal de baja dimensión que retenga una gran parte de la información contenida en el conjunto de datos original. Puede ser el caso que no se pueda aproximar la totalidad del conjunto de datos original utilizando una sola variedad lineal de baja dimensión, aunque grandes subconjuntos de éste sean susceptibles a tales aproximaciones. Para estos casos planteamos el desafío (problema) relacionado pero diferente de localizar subconjuntos de un conjunto de datos de alta dimensión que sean aproximadamente unidimensionales. Naturalmente, estamos interesados en el más grande de tales subconjuntos. Proponemos un método para encontrar estas variedades unidimensionales encontrando cliques en un grafo auxiliar construido a propósito.
Descripción
El análisis de componentes principales es una técnica bien conocida y ampliamente utilizada para determinar la dimensión esencial de un conjunto de datos. En términos generales, su objetivo es encontrar una variedad lineal de baja dimensión que retenga una gran parte de la información contenida en el conjunto de datos original. Puede ser el caso que no se pueda aproximar la totalidad del conjunto de datos original utilizando una sola variedad lineal de baja dimensión, aunque grandes subconjuntos de éste sean susceptibles a tales aproximaciones. Para estos casos planteamos el desafío (problema) relacionado pero diferente de localizar subconjuntos de un conjunto de datos de alta dimensión que sean aproximadamente unidimensionales. Naturalmente, estamos interesados en el más grande de tales subconjuntos. Proponemos un método para encontrar estas variedades unidimensionales encontrando cliques en un grafo auxiliar construido a propósito.