Detección de anomalías en multitudes en cuadros de video utilizando el modelo AlexNet ajustado finamente
Autores: Khan, Arfat Ahmad; Nauman, Muhammad Asif; Shoaib, Muhammad; Jahangir, Rashid; Alroobaea, Roobaea; Alsafyani, Majed; Binmahfoudh, Ahmed; Wechtaisong, Chitapong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección de anomalías en multitudes en cuadros de video utilizando el modelo AlexNet ajustado finamente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Modelo propuesto
Basado en AlexNet
Detección de anomalías
Capas de convolución
Capas totalmente conectadas
AUC
Curva ROC
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Este estudio propuso un modelo de detección de anomalías de multitudes basado en AlexNet en el video (cuadros de imagen). El modelo propuesto estaba compuesto por cuatro capas de convolución (CLs) y tres capas totalmente conectadas (FC). La Unidad Lineal Rectificada (ReLU) se utilizó como función de activación, y los pesos se ajustaron a través del proceso de retropropagación. Las dos primeras CLs son seguidas por una capa de max-pool y normalización por lotes. Las CLs producían características que se utilizaban para detectar la anomalía en el cuadro de imagen. El modelo propuesto se evaluó utilizando dos parámetros: el Área Bajo la Curva (AUC) utilizando la curva Característica Operativa del Receptor (ROC) y la precisión general. Se utilizaron tres conjuntos de datos de referencia compuestos por numerosos cuadros de video con diversas acciones anormales y normales para evaluar el rendimiento. Los resultados experimentales revelaron que el modelo propuesto superó a otros estudios de referencia en los tres conjuntos de datos y logró un AUC del 98% utilizando la curva ROC. Además, el modelo propuesto logró un AUC del 95.6%, 98% y 97% en los conjuntos de datos CUHK Avenue, UCSD Ped-1 y UCSD Ped-2, respectivamente.
Descripción
Este estudio propuso un modelo de detección de anomalías de multitudes basado en AlexNet en el video (cuadros de imagen). El modelo propuesto estaba compuesto por cuatro capas de convolución (CLs) y tres capas totalmente conectadas (FC). La Unidad Lineal Rectificada (ReLU) se utilizó como función de activación, y los pesos se ajustaron a través del proceso de retropropagación. Las dos primeras CLs son seguidas por una capa de max-pool y normalización por lotes. Las CLs producían características que se utilizaban para detectar la anomalía en el cuadro de imagen. El modelo propuesto se evaluó utilizando dos parámetros: el Área Bajo la Curva (AUC) utilizando la curva Característica Operativa del Receptor (ROC) y la precisión general. Se utilizaron tres conjuntos de datos de referencia compuestos por numerosos cuadros de video con diversas acciones anormales y normales para evaluar el rendimiento. Los resultados experimentales revelaron que el modelo propuesto superó a otros estudios de referencia en los tres conjuntos de datos y logró un AUC del 98% utilizando la curva ROC. Además, el modelo propuesto logró un AUC del 95.6%, 98% y 97% en los conjuntos de datos CUHK Avenue, UCSD Ped-1 y UCSD Ped-2, respectivamente.