MultiWave-Net: un red espaciotemporal optimizada para el reconocimiento de acciones anormales utilizando la ampliación de canales basada en wavelets
Autores: Elmasry, Ramez M.; Abd El Ghany, Mohamed A.; Salem, Mohammed A.-M.; Fahmy, Omar M.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
MultiWave-Net: un red espaciotemporal optimizada para el reconocimiento de acciones anormales utilizando la ampliación de canales basada en wavelets
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Comportamiento humano
Comportamiento anormal
Agresión
Accidentes de coche
Monitoreo
Modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
El comportamiento humano es considerado como una de las nociones más complejas presentes en la actualidad, debido a la gran magnitud de posibilidades. Estos comportamientos y acciones pueden distinguirse como normales y anormales. Sin embargo, el comportamiento anormal es un amplio espectro, por lo que en este trabajo se considera como agresión humana o en otro contexto cuando ocurren accidentes de tráfico en la carretera. Dado que este comportamiento puede afectar negativamente a los participantes del tráfico circundante, como vehículos y otros peatones, es crucial monitorear dicho comportamiento. Dada la actual propagación prevalente de cámaras en todas partes con diferentes tipos, estas pueden ser utilizadas para clasificar y monitorear dicho comportamiento. En consecuencia, este trabajo propone un nuevo modelo optimizado basado en una nueva unidad de aumento de canal basada en wavelet integrada para clasificar el comportamiento humano en diversas escenas, con un número total de parámetros entrenables de 5,3 m con un tiempo promedio de inferencia de 0,09 s. El modelo ha sido entrenado y evaluado en cuatro conjuntos de datos públicos: Situaciones Reales de Violencia en Vivo (RLVS), Detección de Incidentes en Autopistas (HWID), Peleas de Películas y Peleas de Hockey. La técnica propuesta logró precisión en un rango de a través de los conjuntos de datos de referencia utilizados. Se realizaron análisis comparativos entre diferentes versiones del modelo y el estado del arte para confirmar el rendimiento del modelo en términos de precisión y eficiencia. El modelo propuesto tiene una precisión más alta con un promedio de y una mayor eficiencia al reducir el número de parámetros en alrededor de 139,1 m en comparación con otros modelos entrenados y probados en los mismos conjuntos de datos de referencia.
Descripción
El comportamiento humano es considerado como una de las nociones más complejas presentes en la actualidad, debido a la gran magnitud de posibilidades. Estos comportamientos y acciones pueden distinguirse como normales y anormales. Sin embargo, el comportamiento anormal es un amplio espectro, por lo que en este trabajo se considera como agresión humana o en otro contexto cuando ocurren accidentes de tráfico en la carretera. Dado que este comportamiento puede afectar negativamente a los participantes del tráfico circundante, como vehículos y otros peatones, es crucial monitorear dicho comportamiento. Dada la actual propagación prevalente de cámaras en todas partes con diferentes tipos, estas pueden ser utilizadas para clasificar y monitorear dicho comportamiento. En consecuencia, este trabajo propone un nuevo modelo optimizado basado en una nueva unidad de aumento de canal basada en wavelet integrada para clasificar el comportamiento humano en diversas escenas, con un número total de parámetros entrenables de 5,3 m con un tiempo promedio de inferencia de 0,09 s. El modelo ha sido entrenado y evaluado en cuatro conjuntos de datos públicos: Situaciones Reales de Violencia en Vivo (RLVS), Detección de Incidentes en Autopistas (HWID), Peleas de Películas y Peleas de Hockey. La técnica propuesta logró precisión en un rango de a través de los conjuntos de datos de referencia utilizados. Se realizaron análisis comparativos entre diferentes versiones del modelo y el estado del arte para confirmar el rendimiento del modelo en términos de precisión y eficiencia. El modelo propuesto tiene una precisión más alta con un promedio de y una mayor eficiencia al reducir el número de parámetros en alrededor de 139,1 m en comparación con otros modelos entrenados y probados en los mismos conjuntos de datos de referencia.