Reconocimiento de acciones consciente del punto de vista utilizando características basadas en esqueletos de imágenes estáticas
Autores: Kim, Seong-heum; Cho, Donghyeon
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Reconocimiento de acciones consciente del punto de vista utilizando características basadas en esqueletos de imágenes estáticas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento de acciones consciente del punto de vista
Características basadas en esqueletos
Articulaciones 2D/3D
Redes neuronales convolucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
En este documento, proponemos un método de reconocimiento de acciones consciente del punto de vista utilizando características basadas en esqueletos de imágenes estáticas. Nuestro método consta de tres pasos principales. Primero, categorizamos el punto de vista de una imagen estática de entrada. En segundo lugar, extraemos articulaciones 2D/3D utilizando redes neuronales convolucionales de última generación y analizamos las relaciones geométricas de las articulaciones para calcular características de esqueleto 2D y 3D. Finalmente, realizamos una clasificación de acciones específicas de la vista por persona, basada en la categorización del punto de vista y las características de esqueleto 2D y 3D extraídas. Implementamos dos sistemas de adquisición de datos multi-vista y creamos un nuevo conjunto de datos de reconocimiento de acciones que contiene las etiquetas de punto de vista, con el fin de entrenar y validar nuestro método. La robustez del método propuesto ante cambios de punto de vista fue confirmada cuantitativamente utilizando dos conjuntos de datos multi-vista. También se demostró cualitativamente una aplicación del mundo real para reconocer diversas acciones.
Descripción
En este documento, proponemos un método de reconocimiento de acciones consciente del punto de vista utilizando características basadas en esqueletos de imágenes estáticas. Nuestro método consta de tres pasos principales. Primero, categorizamos el punto de vista de una imagen estática de entrada. En segundo lugar, extraemos articulaciones 2D/3D utilizando redes neuronales convolucionales de última generación y analizamos las relaciones geométricas de las articulaciones para calcular características de esqueleto 2D y 3D. Finalmente, realizamos una clasificación de acciones específicas de la vista por persona, basada en la categorización del punto de vista y las características de esqueleto 2D y 3D extraídas. Implementamos dos sistemas de adquisición de datos multi-vista y creamos un nuevo conjunto de datos de reconocimiento de acciones que contiene las etiquetas de punto de vista, con el fin de entrenar y validar nuestro método. La robustez del método propuesto ante cambios de punto de vista fue confirmada cuantitativamente utilizando dos conjuntos de datos multi-vista. También se demostró cualitativamente una aplicación del mundo real para reconocer diversas acciones.