Un red de aprendizaje de subespacio profundo bidireccional de dos dimensiones con representación dispersa para reconocimiento de objetos
Autores: Li, Xiaoxue; Feng, Weijia; Wang, Xiaofeng; Guo, Jia; Chen, Yuanxu; Yang, Yumeng; Wang, Chao; Zuo, Xinyu; Xu, Manlu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un red de aprendizaje de subespacio profundo bidireccional de dos dimensiones con representación dispersa para reconocimiento de objetos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Red de análisis de componentes principales
Redes de aprendizaje profundo en subespacios
Restricciones dispersas
Algoritmos bidireccionales de PCANet en dos dimensiones
Red elástica
Información discriminativa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Un análisis de componentes principales en red (PCANet), como una de las redes representativas de aprendizaje de subespacios profundos, utiliza el análisis de componentes principales (PCA) para aprender filtros que representan las características estructurales dominantes de los objetos. Sin embargo, los filtros utilizados en PCANet son combinaciones lineales de todas las variables originales y contienen componentes principales complejos y redundantes, lo que dificulta la interpretación de los resultados. Para abordar este problema, introducimos restricciones dispersas en una red de aprendizaje de subespacios y proponemos tres algoritmos de PCANet bidireccionales bidireccionales bidireccionales dispersos en dos dimensiones, incluido SR2DPCANet disperso por filas, SC2DPCANet disperso por columnas y SRC2DPCANet disperso por filas-columnas. Estos algoritmos realizan operaciones dispersas en las matrices de proyección en la dirección de fila, columna y fila-columna, respectivamente. La dispersión se logra utilizando la red elástica para reducir la carga de los elementos no primarios en los componentes principales a cero y reducir la redundancia en las matrices de proyección, mejorando así la eficiencia de aprendizaje de las redes. Finalmente, una variedad de resultados experimentales en conjuntos de datos ORL, COIL-100, NEC y AR demuestran que los algoritmos propuestos aprenden filtros con información más discriminativa y superan a otras redes de aprendizaje de subespacios y redes de aprendizaje profundo tradicionales en términos de clasificación y rendimiento en tiempo de ejecución, especialmente para un aprendizaje con menos ejemplos.
Descripción
Un análisis de componentes principales en red (PCANet), como una de las redes representativas de aprendizaje de subespacios profundos, utiliza el análisis de componentes principales (PCA) para aprender filtros que representan las características estructurales dominantes de los objetos. Sin embargo, los filtros utilizados en PCANet son combinaciones lineales de todas las variables originales y contienen componentes principales complejos y redundantes, lo que dificulta la interpretación de los resultados. Para abordar este problema, introducimos restricciones dispersas en una red de aprendizaje de subespacios y proponemos tres algoritmos de PCANet bidireccionales bidireccionales bidireccionales dispersos en dos dimensiones, incluido SR2DPCANet disperso por filas, SC2DPCANet disperso por columnas y SRC2DPCANet disperso por filas-columnas. Estos algoritmos realizan operaciones dispersas en las matrices de proyección en la dirección de fila, columna y fila-columna, respectivamente. La dispersión se logra utilizando la red elástica para reducir la carga de los elementos no primarios en los componentes principales a cero y reducir la redundancia en las matrices de proyección, mejorando así la eficiencia de aprendizaje de las redes. Finalmente, una variedad de resultados experimentales en conjuntos de datos ORL, COIL-100, NEC y AR demuestran que los algoritmos propuestos aprenden filtros con información más discriminativa y superan a otras redes de aprendizaje de subespacios y redes de aprendizaje profundo tradicionales en términos de clasificación y rendimiento en tiempo de ejecución, especialmente para un aprendizaje con menos ejemplos.