Modelo de Movimiento Más Rápido Invariante al Fondo para el Reconocimiento de Acciones de Drones
Autores: Kotecha, Ketan; Garg, Deepak; Mishra, Balmukund; Narang, Pratik; Mishra, Vipul Kumar
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Modelo de Movimiento Más Rápido Invariante al Fondo para el Reconocimiento de Acciones de Drones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Datos visuales
Drones
Aplicaciones de vigilancia
Investigadores en visión por computadora
Videos de monitoreo de multitudes
Modelado de movimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los datos visuales recopilados de drones han abierto una nueva dirección para las aplicaciones de vigilancia y recientemente han atraído considerable atención entre los investigadores de visión por computadora. Debido a la disponibilidad y el uso creciente de drones tanto en el sector público como en el privado, es una tecnología crítica y futurista para resolver múltiples problemas de vigilancia en áreas remotas. Uno de los desafíos fundamentales en el reconocimiento de videos de monitoreo de multitudes es el modelado preciso de la característica de movimiento de un individuo. La mayoría de los métodos de vanguardia dependen en gran medida del flujo óptico para el modelado y la representación del movimiento, y el modelado del movimiento a través del flujo óptico es un proceso que consume mucho tiempo. Este artículo subraya este problema y proporciona una nueva arquitectura que elimina la dependencia del flujo óptico. La arquitectura propuesta utiliza dos sub-módulos, FMFM (modelado de características de movimiento más rápido) y AAR (reconocimiento de acción preciso), para clasificar con precisión la acción de vigilancia aérea. Otro problema crítico en la vigilancia aérea es la deficiencia del conjunto de datos. De los pocos conjuntos de datos propuestos recientemente, la mayoría de ellos tienen múltiples humanos realizando diferentes acciones en la misma escena, como un video de monitoreo de multitudes, y por lo tanto no son adecuados para aplicarse directamente al entrenamiento de modelos de reconocimiento de acción. Dado esto, hemos propuesto un nuevo conjunto de datos capturado desde una vista aérea superior que tiene una buena variedad en términos de actores, hora del día y entorno. La arquitectura propuesta ha demostrado la capacidad de aplicarse en diferentes terrenos, ya que elimina el fondo antes de usar el modelo de reconocimiento de acción. La arquitectura propuesta se valida a través de experimentos con diferentes niveles de investigación y logra un rendimiento notable de 0.90 de precisión de validación en el reconocimiento de acciones aéreas.
Descripción
Los datos visuales recopilados de drones han abierto una nueva dirección para las aplicaciones de vigilancia y recientemente han atraído considerable atención entre los investigadores de visión por computadora. Debido a la disponibilidad y el uso creciente de drones tanto en el sector público como en el privado, es una tecnología crítica y futurista para resolver múltiples problemas de vigilancia en áreas remotas. Uno de los desafíos fundamentales en el reconocimiento de videos de monitoreo de multitudes es el modelado preciso de la característica de movimiento de un individuo. La mayoría de los métodos de vanguardia dependen en gran medida del flujo óptico para el modelado y la representación del movimiento, y el modelado del movimiento a través del flujo óptico es un proceso que consume mucho tiempo. Este artículo subraya este problema y proporciona una nueva arquitectura que elimina la dependencia del flujo óptico. La arquitectura propuesta utiliza dos sub-módulos, FMFM (modelado de características de movimiento más rápido) y AAR (reconocimiento de acción preciso), para clasificar con precisión la acción de vigilancia aérea. Otro problema crítico en la vigilancia aérea es la deficiencia del conjunto de datos. De los pocos conjuntos de datos propuestos recientemente, la mayoría de ellos tienen múltiples humanos realizando diferentes acciones en la misma escena, como un video de monitoreo de multitudes, y por lo tanto no son adecuados para aplicarse directamente al entrenamiento de modelos de reconocimiento de acción. Dado esto, hemos propuesto un nuevo conjunto de datos capturado desde una vista aérea superior que tiene una buena variedad en términos de actores, hora del día y entorno. La arquitectura propuesta ha demostrado la capacidad de aplicarse en diferentes terrenos, ya que elimina el fondo antes de usar el modelo de reconocimiento de acción. La arquitectura propuesta se valida a través de experimentos con diferentes niveles de investigación y logra un rendimiento notable de 0.90 de precisión de validación en el reconocimiento de acciones aéreas.