Aprendizaje de Representación de Acción Humana Utilizando una Red 3DCNN Residual Impulsada por Atención
Autores: Ullah, Hayat; Munir, Arslan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje de Representación de Acción Humana Utilizando una Red 3DCNN Residual Impulsada por Atención
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Actividades humanas
Técnicas basadas en visión
Algoritmos de aprendizaje profundo
Reconocimiento de acciones humanas
Eficiencia computacional
Red Neuronal Convolucional Residual 3D de doble atención.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
El reconocimiento de actividades humanas utilizando técnicas basadas en visión se ha convertido en un campo de investigación crucial en análisis de video. Durante la última década, ha habido numerosos avances en algoritmos de aprendizaje profundo destinados a detectar con precisión acciones humanas complejas en transmisiones de video. Si bien estos algoritmos han demostrado un rendimiento impresionante en el reconocimiento de actividades, a menudo muestran un sesgo hacia el rendimiento del modelo o la eficiencia computacional. Este intercambio sesgado entre robustez y eficiencia plantea desafíos al abordar problemas complejos de reconocimiento de actividades humanas. Para abordar este problema, este documento presenta un enfoque computacionalmente eficiente pero robusto, explotando características espaciales y temporales conscientes de la saliencia para el reconocimiento de acciones humanas en videos.
Descripción
El reconocimiento de actividades humanas utilizando técnicas basadas en visión se ha convertido en un campo de investigación crucial en análisis de video. Durante la última década, ha habido numerosos avances en algoritmos de aprendizaje profundo destinados a detectar con precisión acciones humanas complejas en transmisiones de video. Si bien estos algoritmos han demostrado un rendimiento impresionante en el reconocimiento de actividades, a menudo muestran un sesgo hacia el rendimiento del modelo o la eficiencia computacional. Este intercambio sesgado entre robustez y eficiencia plantea desafíos al abordar problemas complejos de reconocimiento de actividades humanas. Para abordar este problema, este documento presenta un enfoque computacionalmente eficiente pero robusto, explotando características espaciales y temporales conscientes de la saliencia para el reconocimiento de acciones humanas en videos.