Método de reducción de dimensiones que preserva la distancia para mejorar la clasificación de conjuntos de datos biomédicos basado en topología local
Autores: Khosla, Karaj; Jha, Indra Prakash; Kumar, Ajit; Kumar, Vibhor
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Método de reducción de dimensiones que preserva la distancia para mejorar la clasificación de conjuntos de datos biomédicos basado en topología local
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Reducción de dimensiones
Conjuntos de datos biomédicos
Información de distancia
Topología local
TPDS
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
La reducción de dimensiones se utiliza a menudo para varios procedimientos de análisis de conjuntos de datos biomédicos de alta dimensión, como la clasificación o la detección de valores atípicos. Para mejorar el rendimiento de estos pasos de minería de datos, preservar tanto la información de distancia como la topología local entre los puntos de datos podría ser más útil que dar prioridad a la visualización en baja dimensión. Por lo tanto, presentamos el escalado de distancia preservando la topología (TPDS) para complementar un método de reducción de dimensiones destinado a reproducir la información de distancia en una dimensión superior. Nuestro enfoque implica la inflación de distancias para preservar la topología local y evitar el colapso durante la optimización basada en la preservación de distancias. La aplicación de TPDS en diversos conjuntos de datos biomédicos reveló que, además de proporcionar una mejor visualización que los métodos típicos de preservación de distancias, TPDS conduce a una mejor clasificación de puntos de datos en dimensiones reducidas. Para conjuntos de datos con valores atípicos, el enfoque de TPDS también resulta útil, incluso para un método puramente de preservación de distancias para lograr una mejor convergencia.
Descripción
La reducción de dimensiones se utiliza a menudo para varios procedimientos de análisis de conjuntos de datos biomédicos de alta dimensión, como la clasificación o la detección de valores atípicos. Para mejorar el rendimiento de estos pasos de minería de datos, preservar tanto la información de distancia como la topología local entre los puntos de datos podría ser más útil que dar prioridad a la visualización en baja dimensión. Por lo tanto, presentamos el escalado de distancia preservando la topología (TPDS) para complementar un método de reducción de dimensiones destinado a reproducir la información de distancia en una dimensión superior. Nuestro enfoque implica la inflación de distancias para preservar la topología local y evitar el colapso durante la optimización basada en la preservación de distancias. La aplicación de TPDS en diversos conjuntos de datos biomédicos reveló que, además de proporcionar una mejor visualización que los métodos típicos de preservación de distancias, TPDS conduce a una mejor clasificación de puntos de datos en dimensiones reducidas. Para conjuntos de datos con valores atípicos, el enfoque de TPDS también resulta útil, incluso para un método puramente de preservación de distancias para lograr una mejor convergencia.