Un estudio de revisión y comparativo de modelos de aprendizaje profundo explicables aplicados en el reconocimiento de acciones en tiempo real
Autores: Mahmoudi, Sidi Ahmed; Amel, Otmane; Stassin, Sédrick; Liagre, Margot; Benkedadra, Mohamed; Mancas, Matei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un estudio de revisión y comparativo de modelos de aprendizaje profundo explicables aplicados en el reconocimiento de acciones en tiempo real
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Vigilancia por video
Sistemas de adquisición de imágenes
Visión por computadora
Soluciones de aprendizaje profundo
Análisis de comportamiento
Detección de acciones peligrosas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
Los sistemas de videovigilancia y adquisición de imágenes representan uno de los temas de investigación más activos en las áreas de visión por computadora y ciudades inteligentes. La creciente preocupación por la seguridad pública y de los trabajadores ha llevado a un aumento significativo en el uso de cámaras de vigilancia que proporcionan imágenes de alta definición e incluso mapas de profundidad cuando se dispone de cámaras 3D. En consecuencia, la necesidad de técnicas automáticas para el análisis de comportamiento y reconocimiento de acciones también está aumentando para varias aplicaciones como la detección de acciones peligrosas en estaciones de tren o sitios de construcción, detección de eventos en videos de multitudes, análisis de comportamiento, optimización en sitios industriales, etc. En este contexto, se han propuesto recientemente varias soluciones de visión por computadora y aprendizaje profundo donde las redes neuronales profundas proporcionaron soluciones más precisas, pero no son tan eficientes en términos de explicabilidad y flexibilidad ya que permanecen adaptadas solo para situaciones específicas. Además, la complejidad de las arquitecturas de redes neuronales profundas requiere el uso de recursos informáticos altos para proporcionar cálculos rápidos y en tiempo real. En este documento, proponemos una revisión y un análisis comparativo de soluciones de aprendizaje profundo en términos de precisión, explicabilidad, tiempo de computación, tamaño de memoria y flexibilidad. Se realizan experimentos con acciones peligrosas simuladas y reales en sitios de construcción ferroviaria. Gracias a nuestro análisis comparativo y evaluación, proponemos un enfoque personalizado para el reconocimiento de acciones peligrosas dependiendo del tipo de datos recopilados (imagen) y de los requisitos de los usuarios.
Descripción
Los sistemas de videovigilancia y adquisición de imágenes representan uno de los temas de investigación más activos en las áreas de visión por computadora y ciudades inteligentes. La creciente preocupación por la seguridad pública y de los trabajadores ha llevado a un aumento significativo en el uso de cámaras de vigilancia que proporcionan imágenes de alta definición e incluso mapas de profundidad cuando se dispone de cámaras 3D. En consecuencia, la necesidad de técnicas automáticas para el análisis de comportamiento y reconocimiento de acciones también está aumentando para varias aplicaciones como la detección de acciones peligrosas en estaciones de tren o sitios de construcción, detección de eventos en videos de multitudes, análisis de comportamiento, optimización en sitios industriales, etc. En este contexto, se han propuesto recientemente varias soluciones de visión por computadora y aprendizaje profundo donde las redes neuronales profundas proporcionaron soluciones más precisas, pero no son tan eficientes en términos de explicabilidad y flexibilidad ya que permanecen adaptadas solo para situaciones específicas. Además, la complejidad de las arquitecturas de redes neuronales profundas requiere el uso de recursos informáticos altos para proporcionar cálculos rápidos y en tiempo real. En este documento, proponemos una revisión y un análisis comparativo de soluciones de aprendizaje profundo en términos de precisión, explicabilidad, tiempo de computación, tamaño de memoria y flexibilidad. Se realizan experimentos con acciones peligrosas simuladas y reales en sitios de construcción ferroviaria. Gracias a nuestro análisis comparativo y evaluación, proponemos un enfoque personalizado para el reconocimiento de acciones peligrosas dependiendo del tipo de datos recopilados (imagen) y de los requisitos de los usuarios.