Interpretable multi-channel capsule network para el reconocimiento del movimiento humano
Autores: Li, Peizhang; Fei, Qing; Chen, Zhen; Liu, Xiangdong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Interpretable multi-channel capsule network para el reconocimiento del movimiento humano
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Cápsulas de redes
Reconocimiento de movimiento humano
Arquitectura de redes neuronales
Interpretabilidad
Dimensiones espaciales
Red de cápsulas de múltiples canales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Recientemente, las redes de cápsulas han surgido como una nueva arquitectura de red neuronal para el reconocimiento del movimiento humano debido a su mejor interpretabilidad en comparación con las redes de aprendizaje profundo tradicionales. Sin embargo, las características características del movimiento humano a menudo se distribuyen en dimensiones espaciales distintas y las redes de cápsulas existentes luchan por extraer y combinar de forma independiente características en múltiples dimensiones espaciales. En este artículo, proponemos una nueva arquitectura de red de cápsulas de múltiples canales que extrae cápsulas de características en diferentes dimensiones espaciales, genera una cadena de cápsulas de múltiples canales con enrutamiento independiente dentro de cada canal y culmina en la agregación de información de cápsulas en diferentes canales para activar categorías. La estructura propuesta dota a la red con la capacidad de agrupar de forma independiente características interpretables dentro de diferentes canales; agrega características a lo largo de los canales durante la clasificación, mejorando así la precisión y robustez de la clasificación; y también presenta el potencial para explorar primitivas interpretables dentro de canales individuales. Comparaciones experimentales con varias estructuras de redes de cápsulas existentes demuestran el rendimiento superior de la arquitectura propuesta. Además, a diferencia de estudios anteriores que discutían vagamente la interpretabilidad de las redes de cápsulas, incluimos experimentos visuales adicionales que ilustran la interpretabilidad de la estructura de red propuesta en escenarios prácticos.
Descripción
Recientemente, las redes de cápsulas han surgido como una nueva arquitectura de red neuronal para el reconocimiento del movimiento humano debido a su mejor interpretabilidad en comparación con las redes de aprendizaje profundo tradicionales. Sin embargo, las características características del movimiento humano a menudo se distribuyen en dimensiones espaciales distintas y las redes de cápsulas existentes luchan por extraer y combinar de forma independiente características en múltiples dimensiones espaciales. En este artículo, proponemos una nueva arquitectura de red de cápsulas de múltiples canales que extrae cápsulas de características en diferentes dimensiones espaciales, genera una cadena de cápsulas de múltiples canales con enrutamiento independiente dentro de cada canal y culmina en la agregación de información de cápsulas en diferentes canales para activar categorías. La estructura propuesta dota a la red con la capacidad de agrupar de forma independiente características interpretables dentro de diferentes canales; agrega características a lo largo de los canales durante la clasificación, mejorando así la precisión y robustez de la clasificación; y también presenta el potencial para explorar primitivas interpretables dentro de canales individuales. Comparaciones experimentales con varias estructuras de redes de cápsulas existentes demuestran el rendimiento superior de la arquitectura propuesta. Además, a diferencia de estudios anteriores que discutían vagamente la interpretabilidad de las redes de cápsulas, incluimos experimentos visuales adicionales que ilustran la interpretabilidad de la estructura de red propuesta en escenarios prácticos.