Mejorando la Detección de Anomalías en Videos con Supervisión Débil mediante Características Centradas en Objetos
Autores: Wang, Yanyu; Chen, Yang; Yeo, Chai Kiat
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejorando la Detección de Anomalías en Videos con Supervisión Débil mediante Características Centradas en Objetos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Cámaras de vigilancia
Sistemas de monitoreo de video inteligentes
Detección de anomalías en video débilmente supervisada
Aprendizaje de múltiples instancias
Técnicas de detección de objetos
Información semántica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las cámaras de vigilancia están ampliamente desplegadas en entornos públicos y privados, lo que impulsa la necesidad de sistemas de monitoreo de video inteligentes. Sin embargo, surge un gran desafío en la Detección de Anomalías en Video Débilmente Supervisada (WSVAD), donde la supervisión se limita a etiquetas a nivel de video, lo que hace que la localización de anomalías a nivel de fragmento sea particularmente difícil. Este desafío a menudo se formula como un problema de Aprendizaje de Múltiples Instancias (MIL). Aunque enfoques recientes han logrado resultados alentadores al modelar dinámicas espaciotemporales, a menudo pasan por alto la información semántica dentro de los videos que podría mejorar aún más la detección de anomalías. Para cerrar esta brecha, proponemos enriquecer las representaciones de características aplicando técnicas de detección de objetos para extraer características centradas en objetos. Estas características proporcionan información semántica de alto nivel suplementaria que apoya la discriminación de eventos anómalos. Los experimentos realizados en dos conjuntos de datos de referencia, UCF-Crime y ShanghaiTech, demuestran que nuestro enfoque logra un rendimiento comparable a los métodos de última generación (SOTA). Los resultados destacan que incorporar semánticas a nivel de objeto ofrece una dirección prometedora para mejorar WSVAD, subrayando el potencial de enfoques conscientes de la semántica para una detección de anomalías más efectiva.
Descripción
Las cámaras de vigilancia están ampliamente desplegadas en entornos públicos y privados, lo que impulsa la necesidad de sistemas de monitoreo de video inteligentes. Sin embargo, surge un gran desafío en la Detección de Anomalías en Video Débilmente Supervisada (WSVAD), donde la supervisión se limita a etiquetas a nivel de video, lo que hace que la localización de anomalías a nivel de fragmento sea particularmente difícil. Este desafío a menudo se formula como un problema de Aprendizaje de Múltiples Instancias (MIL). Aunque enfoques recientes han logrado resultados alentadores al modelar dinámicas espaciotemporales, a menudo pasan por alto la información semántica dentro de los videos que podría mejorar aún más la detección de anomalías. Para cerrar esta brecha, proponemos enriquecer las representaciones de características aplicando técnicas de detección de objetos para extraer características centradas en objetos. Estas características proporcionan información semántica de alto nivel suplementaria que apoya la discriminación de eventos anómalos. Los experimentos realizados en dos conjuntos de datos de referencia, UCF-Crime y ShanghaiTech, demuestran que nuestro enfoque logra un rendimiento comparable a los métodos de última generación (SOTA). Los resultados destacan que incorporar semánticas a nivel de objeto ofrece una dirección prometedora para mejorar WSVAD, subrayando el potencial de enfoques conscientes de la semántica para una detección de anomalías más efectiva.