Técnicas robustas de incrustación lineal local de Hessiano para datos de alta dimensionalidad
Autores: Xing, Xianglei; Du, Sidan; Wang, Kejun
Idioma: Inglés
Editor: MDPI
Año: 2016
Acceso abierto
Artículo científico
2016
Técnicas robustas de incrustación lineal local de Hessiano para datos de alta dimensionalidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aprendizaje de variedades
Método robusto
Valores atípicos
Ruido
Algoritmo RHLLE
Incrustación lineal local de Hessiano
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Recientemente, el aprendizaje de variedades ha recibido un amplio interés en la comunidad de reconocimiento de patrones. A pesar de sus propiedades atractivas, la mayoría de los algoritmos de aprendizaje de variedades no son robustos en aplicaciones prácticas. En este documento, abordamos este problema en el contexto del algoritmo de incrustación lineal local de Hessian (HLLE) y proponemos un método más robusto, llamado RHLLE, que tiene como objetivo ser robusto tanto contra valores atípicos como contra ruido en los datos. Específicamente, primero proponemos un método rápido de detección de valores atípicos para conjuntos de datos de alta dimensionalidad. Luego, empleamos un método de suavizado local para reducir el ruido. Además, reformulamos el algoritmo HLLE original utilizando la función de truncamiento de variedades diferenciables. En el marco reformulado, introducimos explícitamente una funcional global ponderada para reducir aún más el efecto no deseado de valores atípicos y ruido en el resultado de la incrustación. Experimentos en conjuntos de datos sintéticos y reales demuestran la efectividad de nuestro algoritmo propuesto.
Descripción
Recientemente, el aprendizaje de variedades ha recibido un amplio interés en la comunidad de reconocimiento de patrones. A pesar de sus propiedades atractivas, la mayoría de los algoritmos de aprendizaje de variedades no son robustos en aplicaciones prácticas. En este documento, abordamos este problema en el contexto del algoritmo de incrustación lineal local de Hessian (HLLE) y proponemos un método más robusto, llamado RHLLE, que tiene como objetivo ser robusto tanto contra valores atípicos como contra ruido en los datos. Específicamente, primero proponemos un método rápido de detección de valores atípicos para conjuntos de datos de alta dimensionalidad. Luego, empleamos un método de suavizado local para reducir el ruido. Además, reformulamos el algoritmo HLLE original utilizando la función de truncamiento de variedades diferenciables. En el marco reformulado, introducimos explícitamente una funcional global ponderada para reducir aún más el efecto no deseado de valores atípicos y ruido en el resultado de la incrustación. Experimentos en conjuntos de datos sintéticos y reales demuestran la efectividad de nuestro algoritmo propuesto.