Reconocimiento de acciones humanas basado en visión por computadora utilizando características de movimiento espacio-temporal (STMF) con patrón de grupo de distancia de intensidad diferencial (DIDGP)
Autores: Arunnehru, Jawaharlalnehru; Thalapathiraj, Sambandham; Dhanasekar, Ravikumar; Vijayaraja, Loganathan; Kannadasan, Raju; Khan, Arfat Ahmad; Haq, Mohd Anul; Alshehri, Mohammed; Alwanain, Mohamed Ibrahim; Keshta, Ismail
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Reconocimiento de acciones humanas basado en visión por computadora utilizando características de movimiento espacio-temporal (STMF) con patrón de grupo de distancia de intensidad diferencial (DIDGP)
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Enfoque
Puntos de interés espacio-temporales
STIPs
Reconocimiento de acciones
Descriptores
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
En los últimos años, el reconocimiento de acciones humanas se modela como un volumen de video espacial-temporal. Tales aspectos han crecido enormemente recientemente debido a sus usos en evolución explosiva en el mundo real, como la vigilancia visual, la conducción autónoma y el entretenimiento. Específicamente, el enfoque de puntos de interés espacio-temporales (STIPs) ha sido ampliamente y eficientemente utilizado en la representación de acciones para el reconocimiento. En este trabajo, se propone un enfoque novedoso basado en los STIPs para descriptores de acciones, es decir, el Patrón de Grupo de Distancia de Intensidad de Diferencia Bidimensional (2D-DIDGP) y el Patrón de Grupo de Distancia de Intensidad de Diferencia Tridimensional (3D-DIDGP) para representar y reconocer las acciones humanas en secuencias de video. Inicialmente, este enfoque captura el movimiento local en un video que es invariante a cambios de tamaño y forma. Este enfoque se extiende aún más para construir métodos de descripción de características únicas y discriminativas para mejorar la tasa de reconocimiento de acciones. Se utilizan métodos de transformación, como la DCT (Transformada del coseno discreta), la DWT (Transformadas wavelet discretas) y la híbrida DWT+DCT. El enfoque propuesto se valida en el conjunto de datos UT-Interaction que ha sido ampliamente estudiado por investigadores anteriores. Luego, se explotan métodos de clasificación, como las máquinas de vectores de soporte (SVM) y los clasificadores de bosques aleatorios (RF). A partir de los resultados observados, se percibe que los descriptores propuestos, especialmente el descriptor basado en DIDGP, ofrecen resultados prometedores en el reconocimiento de acciones. Especialmente, el 3D-DIDGP supera predominantemente al algoritmo de última generación.
Descripción
En los últimos años, el reconocimiento de acciones humanas se modela como un volumen de video espacial-temporal. Tales aspectos han crecido enormemente recientemente debido a sus usos en evolución explosiva en el mundo real, como la vigilancia visual, la conducción autónoma y el entretenimiento. Específicamente, el enfoque de puntos de interés espacio-temporales (STIPs) ha sido ampliamente y eficientemente utilizado en la representación de acciones para el reconocimiento. En este trabajo, se propone un enfoque novedoso basado en los STIPs para descriptores de acciones, es decir, el Patrón de Grupo de Distancia de Intensidad de Diferencia Bidimensional (2D-DIDGP) y el Patrón de Grupo de Distancia de Intensidad de Diferencia Tridimensional (3D-DIDGP) para representar y reconocer las acciones humanas en secuencias de video. Inicialmente, este enfoque captura el movimiento local en un video que es invariante a cambios de tamaño y forma. Este enfoque se extiende aún más para construir métodos de descripción de características únicas y discriminativas para mejorar la tasa de reconocimiento de acciones. Se utilizan métodos de transformación, como la DCT (Transformada del coseno discreta), la DWT (Transformadas wavelet discretas) y la híbrida DWT+DCT. El enfoque propuesto se valida en el conjunto de datos UT-Interaction que ha sido ampliamente estudiado por investigadores anteriores. Luego, se explotan métodos de clasificación, como las máquinas de vectores de soporte (SVM) y los clasificadores de bosques aleatorios (RF). A partir de los resultados observados, se percibe que los descriptores propuestos, especialmente el descriptor basado en DIDGP, ofrecen resultados prometedores en el reconocimiento de acciones. Especialmente, el 3D-DIDGP supera predominantemente al algoritmo de última generación.