Convoluciones enmascaradas dentro de conexiones de salto para la detección de anomalías en video
Autores: Lappas, Demetris; Argyriou, Vasileios; Makris, Dimitrios
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Convoluciones enmascaradas dentro de conexiones de salto para la detección de anomalías en video
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Detección de anomalías en video
Capas MaskedConv3D
Arquitectura UNet
Propagación de información
Regiones temporales
Núcleos convolucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La detección de anomalías en video juega un papel crucial en varios campos como la vigilancia, el monitoreo de la salud y el control de calidad industrial. Este artículo de investigación introduce una contribución novedosa al campo al presentar capas MaskedConv3D dentro de una arquitectura UNet modificada. Estas capas MaskedConv3D proporcionan un enfoque único para la propagación de información en datos de video tridimensionales al enmascarar selectivamente regiones temporales de los núcleos convolucionales. Al incorporar estas capas en las conexiones de omisión de la UNet, el modelo adquiere la capacidad de inferir información faltante en el dominio temporal basándose en el contexto circundante. Este mecanismo innovador mejora la preservación de detalles espaciales y temporales, abordando el desafío de detectar anomalías de manera efectiva en datos de video. La metodología propuesta se evalúa en conjuntos de datos de video populares, mostrando su efectividad en capturar patrones y contextos intrincados. Los resultados resaltan la superioridad de la UNet modificada con capas MaskedConv3D en comparación con enfoques tradicionales. En general, esta investigación introduce una técnica novedosa para la propagación de información en datos de video y demuestra su potencial para avanzar en la detección de anomalías en video.
Descripción
La detección de anomalías en video juega un papel crucial en varios campos como la vigilancia, el monitoreo de la salud y el control de calidad industrial. Este artículo de investigación introduce una contribución novedosa al campo al presentar capas MaskedConv3D dentro de una arquitectura UNet modificada. Estas capas MaskedConv3D proporcionan un enfoque único para la propagación de información en datos de video tridimensionales al enmascarar selectivamente regiones temporales de los núcleos convolucionales. Al incorporar estas capas en las conexiones de omisión de la UNet, el modelo adquiere la capacidad de inferir información faltante en el dominio temporal basándose en el contexto circundante. Este mecanismo innovador mejora la preservación de detalles espaciales y temporales, abordando el desafío de detectar anomalías de manera efectiva en datos de video. La metodología propuesta se evalúa en conjuntos de datos de video populares, mostrando su efectividad en capturar patrones y contextos intrincados. Los resultados resaltan la superioridad de la UNet modificada con capas MaskedConv3D en comparación con enfoques tradicionales. En general, esta investigación introduce una técnica novedosa para la propagación de información en datos de video y demuestra su potencial para avanzar en la detección de anomalías en video.