Laplacian eigenmaps reducción de dimensionalidad basada en similitud ajustada por agrupamiento
Autores: Zhou, Honghu; Wang, Jun
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Laplacian eigenmaps reducción de dimensionalidad basada en similitud ajustada por agrupamiento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Distancia euclidiana
Estructura de variedad
Reducción de dimensionalidad basada en grafos
Mapas de eigenvalores de Laplacian
Similitud ajustada por agrupamiento
Conjuntos de datos de UCI
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 58
Citaciones: Sin citaciones
La distancia euclidiana entre instancias se utiliza ampliamente para capturar la estructura de los datos y para la reducción de dimensionalidad basada en grafos. Sin embargo, en algunas circunstancias, la distancia euclidiana básica no puede capturar con precisión la similitud entre instancias; algunas instancias de diferentes clases pero cercanas al límite de decisión pueden estar cerca una de la otra, lo que puede llevar a un error en la reducción de dimensionalidad basada en grafos y comprometer el rendimiento. Para mitigar este problema, en este artículo, propusimos un enfoque llamado Mapas Eigen de Laplaciano basado en Similitud Ajustada por Agrupamiento (LE-CAS). LE-CAS primero realiza agrupamiento en todas las instancias para explorar la estructura global y la discriminación de las instancias, y cuantifica la similitud entre los centros de los grupos. Luego, ajusta la similitud entre instancias emparejadas multiplicando la similitud entre los centros de los grupos a los que pertenecen respectivamente estas dos instancias. De esta manera, si dos instancias son de diferentes grupos, la similitud entre ellas se reduce; de lo contrario, no cambia. Finalmente, LE-CAS realiza reducción de dimensionalidad basada en grafos (a través de Mapas Eigen de Laplaciano) basada en la similitud ajustada. Realizamos estudios empíricos exhaustivos en conjuntos de datos de UCI y mostramos que LE-CAS no solo tiene un mejor rendimiento que otros métodos comparativos relevantes, sino que también es más robusto a los parámetros de entrada.
Descripción
La distancia euclidiana entre instancias se utiliza ampliamente para capturar la estructura de los datos y para la reducción de dimensionalidad basada en grafos. Sin embargo, en algunas circunstancias, la distancia euclidiana básica no puede capturar con precisión la similitud entre instancias; algunas instancias de diferentes clases pero cercanas al límite de decisión pueden estar cerca una de la otra, lo que puede llevar a un error en la reducción de dimensionalidad basada en grafos y comprometer el rendimiento. Para mitigar este problema, en este artículo, propusimos un enfoque llamado Mapas Eigen de Laplaciano basado en Similitud Ajustada por Agrupamiento (LE-CAS). LE-CAS primero realiza agrupamiento en todas las instancias para explorar la estructura global y la discriminación de las instancias, y cuantifica la similitud entre los centros de los grupos. Luego, ajusta la similitud entre instancias emparejadas multiplicando la similitud entre los centros de los grupos a los que pertenecen respectivamente estas dos instancias. De esta manera, si dos instancias son de diferentes grupos, la similitud entre ellas se reduce; de lo contrario, no cambia. Finalmente, LE-CAS realiza reducción de dimensionalidad basada en grafos (a través de Mapas Eigen de Laplaciano) basada en la similitud ajustada. Realizamos estudios empíricos exhaustivos en conjuntos de datos de UCI y mostramos que LE-CAS no solo tiene un mejor rendimiento que otros métodos comparativos relevantes, sino que también es más robusto a los parámetros de entrada.