2s-GATCN: redes convolucionales atencionales de gráficos de dos flujos para reconocimiento de acciones basado en esqueletos
Autores: Zhou, Shu-Bo; Chen, Ran-Ran; Jiang, Xue-Qin; Pan, Feng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
2s-GATCN: redes convolucionales atencionales de gráficos de dos flujos para reconocimiento de acciones basado en esqueletos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Acciones humanas
Articulaciones del esqueleto
Técnicas de reconocimiento de acción
Red convolucional gráfica
Módulo de atención de bloque convolucional
Correlaciones semánticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
A medida que las acciones humanas pueden ser caracterizadas por las trayectorias de las articulaciones del esqueleto, las técnicas de reconocimiento de acciones basadas en esqueletos han ganado cada vez más atención en el campo del reconocimiento inteligente y el análisis del comportamiento. Con la aparición de grandes conjuntos de datos, los enfoques de redes convolucionales de grafos (GCN) se han aplicado ampliamente para el reconocimiento de acciones basado en esqueletos y han logrado un rendimiento notable. En este documento, se propone un enfoque novedoso basado en GCN al introducir un módulo de atención de bloque convolucional (CBAM) para calcular el bloque de atención de grafos basado en correlaciones semánticas entre cualquier par de vértices. Al considerar las correlaciones semánticas, nuestro modelo puede identificar de manera efectiva las conexiones de vértices más discriminativas asociadas con acciones específicas, incluso cuando los dos vértices no están físicamente conectados. Los resultados experimentales demuestran que el modelo propuesto es efectivo y supera a los métodos existentes.
Descripción
A medida que las acciones humanas pueden ser caracterizadas por las trayectorias de las articulaciones del esqueleto, las técnicas de reconocimiento de acciones basadas en esqueletos han ganado cada vez más atención en el campo del reconocimiento inteligente y el análisis del comportamiento. Con la aparición de grandes conjuntos de datos, los enfoques de redes convolucionales de grafos (GCN) se han aplicado ampliamente para el reconocimiento de acciones basado en esqueletos y han logrado un rendimiento notable. En este documento, se propone un enfoque novedoso basado en GCN al introducir un módulo de atención de bloque convolucional (CBAM) para calcular el bloque de atención de grafos basado en correlaciones semánticas entre cualquier par de vértices. Al considerar las correlaciones semánticas, nuestro modelo puede identificar de manera efectiva las conexiones de vértices más discriminativas asociadas con acciones específicas, incluso cuando los dos vértices no están físicamente conectados. Los resultados experimentales demuestran que el modelo propuesto es efectivo y supera a los métodos existentes.