Un modelo para detectar comportamiento anormal de pasajeros de ascensor basado en clasificación de video
Autores: Lei, Jingsheng; Sun, Wanfa; Fang, Yuhao; Ye, Ning; Yang, Shengying; Wu, Jianfeng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo para detectar comportamiento anormal de pasajeros de ascensor basado en clasificación de video
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación de videos
Aprendizaje profundo
Características de comportamiento
Mecanismo de atención dilatada a múltiples escalas
Comportamiento humano anormal
Módulo de fusión de información de características de flujo de gradiente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
En la tarea de detección de comportamiento humano, la clasificación de videos basada en aprendizaje profundo se ha convertido en una técnica prevalente. Los modelos existentes están limitados debido a una comprensión inadecuada de las características del comportamiento, lo que restringe su capacidad para lograr resultados de reconocimiento más precisos. Para abordar este problema, este documento propone un nuevo modelo, que es una mejora del modelo PPTSM existente. Específicamente, nuestro modelo emplea un mecanismo de atención dilatada multi-escala, que permite que el modelo integre información semántica multi-escala y capture información característica del comportamiento humano anormal de manera más efectiva. Además, para mejorar la información característica del comportamiento humano, proponemos un módulo de fusión de información de características de flujo de gradiente que integra características semánticas de alto nivel con características de detalle de bajo nivel, lo que permite que la red extraiga características más completas. Los experimentos realizados en un conjunto de datos de pasajeros de ascensor que contiene cuatro comportamientos anormales (abrir la puerta, saltar, dar patadas y bloquear la puerta) muestran que el Acc superior-1 de nuestro modelo se mejora en un 10% en comparación con el modelo PPTSM, alcanzando el 95%. Además, los experimentos con cuatro conjuntos de datos disponibles públicamente (UCF24, UCF101, HMDB51 y el conjunto de datos Something-Something-v1) demuestran que nuestro método logra resultados superiores a PPTSM en un 6,8%, 6,1%, 21,2% y 3,96%, respectivamente.
Descripción
En la tarea de detección de comportamiento humano, la clasificación de videos basada en aprendizaje profundo se ha convertido en una técnica prevalente. Los modelos existentes están limitados debido a una comprensión inadecuada de las características del comportamiento, lo que restringe su capacidad para lograr resultados de reconocimiento más precisos. Para abordar este problema, este documento propone un nuevo modelo, que es una mejora del modelo PPTSM existente. Específicamente, nuestro modelo emplea un mecanismo de atención dilatada multi-escala, que permite que el modelo integre información semántica multi-escala y capture información característica del comportamiento humano anormal de manera más efectiva. Además, para mejorar la información característica del comportamiento humano, proponemos un módulo de fusión de información de características de flujo de gradiente que integra características semánticas de alto nivel con características de detalle de bajo nivel, lo que permite que la red extraiga características más completas. Los experimentos realizados en un conjunto de datos de pasajeros de ascensor que contiene cuatro comportamientos anormales (abrir la puerta, saltar, dar patadas y bloquear la puerta) muestran que el Acc superior-1 de nuestro modelo se mejora en un 10% en comparación con el modelo PPTSM, alcanzando el 95%. Además, los experimentos con cuatro conjuntos de datos disponibles públicamente (UCF24, UCF101, HMDB51 y el conjunto de datos Something-Something-v1) demuestran que nuestro método logra resultados superiores a PPTSM en un 6,8%, 6,1%, 21,2% y 3,96%, respectivamente.