Red de autoencoder de gráficos espacio-temporales para el reconocimiento de acciones humanas basado en esqueletos
Autores: Abduljalil, Hosam; Elhayek, Ahmed; Marish Ali, Abdullah; Alsolami, Fawaz
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Red de autoencoder de gráficos espacio-temporales para el reconocimiento de acciones humanas basado en esqueletos
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Reconocimiento de acciones humanas
Datos de esqueleto
Red autoencoder de gráficos espacio-temporales
GA-GCN
Conjunto de datos NTU RGB+D
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El reconocimiento de acciones humanas (HAR) basado en datos de esqueleto es una tarea desafiante pero crucial debido a sus amplias aplicaciones, que incluyen monitoreo de pacientes, vigilancia de seguridad e interacción humano-máquina. Aunque se han propuesto numerosos algoritmos para distinguir entre diversas actividades, la mayoría de las aplicaciones prácticas requieren una detección altamente precisa de acciones específicas. En este estudio, proponemos una red autoencoder gráfica espaciotemporal novedosa y altamente precisa para HAR, designada como GA-GCN. Además, se llevó a cabo una investigación extensa empleando diversas modalidades. Con este fin, se construyó un autoencoder gráfico espaciotemporal para aprender automáticamente patrones espaciales y temporales de datos de esqueleto. El método propuesto logró precisión del 92.3% y 96.8% en el conjunto de datos NTU RGB+D para evaluaciones entre sujetos y entre vistas, respectivamente. En el conjunto de datos más desafiante NTU RGB+D 120, GA-GCN alcanzó precisión del 88.8% y 90.4% para evaluaciones entre sujetos y entre conjuntos. En general, nuestro modelo supera a la mayoría de los métodos de vanguardia existentes en estos conjuntos de datos de referencia comunes.
Descripción
El reconocimiento de acciones humanas (HAR) basado en datos de esqueleto es una tarea desafiante pero crucial debido a sus amplias aplicaciones, que incluyen monitoreo de pacientes, vigilancia de seguridad e interacción humano-máquina. Aunque se han propuesto numerosos algoritmos para distinguir entre diversas actividades, la mayoría de las aplicaciones prácticas requieren una detección altamente precisa de acciones específicas. En este estudio, proponemos una red autoencoder gráfica espaciotemporal novedosa y altamente precisa para HAR, designada como GA-GCN. Además, se llevó a cabo una investigación extensa empleando diversas modalidades. Con este fin, se construyó un autoencoder gráfico espaciotemporal para aprender automáticamente patrones espaciales y temporales de datos de esqueleto. El método propuesto logró precisión del 92.3% y 96.8% en el conjunto de datos NTU RGB+D para evaluaciones entre sujetos y entre vistas, respectivamente. En el conjunto de datos más desafiante NTU RGB+D 120, GA-GCN alcanzó precisión del 88.8% y 90.4% para evaluaciones entre sujetos y entre conjuntos. En general, nuestro modelo supera a la mayoría de los métodos de vanguardia existentes en estos conjuntos de datos de referencia comunes.