Detección de peatones basada en eventos utilizando sensores de visión dinámica
Autores: Wan, Jixiang; Xia, Ming; Huang, Zunkai; Tian, Li; Zheng, Xiaoying; Chang, Victor; Zhu, Yongxin; Wang, Hui
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de peatones basada en eventos utilizando sensores de visión dinámica
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de peatones
Sensor de visión dinámica
Conversión de evento a cuadro
Red de extracción de características
Precisión de detección
Detección en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
La detección de peatones ha atraído gran atención en la investigación en videovigilancia, estadísticas de tráfico y especialmente en la conducción autónoma. Hasta la fecha, casi todas las soluciones de detección de peatones se derivan de sensores de imagen basados en fotogramas convencionales con velocidad de reacción limitada y alta redundancia de datos. El sensor de visión dinámica (DVS), inspirado en las retinas biológicas, captura eficientemente la información visual con eventos dispersos y asíncronos en lugar de fotogramas densos y sincrónicos. Puede eliminar la transmisión de datos redundantes y evitar el desenfoque por movimiento o la fuga de datos en aplicaciones de imágenes de alta velocidad. Sin embargo, generalmente es impráctico aplicar directamente los flujos de eventos a algoritmos convencionales de detección de objetos. Para este problema, primero proponemos un nuevo método de conversión de eventos a fotogramas integrando las características inherentes de los eventos de manera más eficiente. Además, diseñamos una red de extracción de características mejorada que puede reutilizar características intermedias para reducir aún más el esfuerzo computacional. Evaluamos el rendimiento de nuestro método propuesto en un conjunto de datos personalizado que contiene múltiples escenas de peatones del mundo real. Los resultados indican que nuestro método propuesto aumentó la precisión de detección de peatones en aproximadamente un 5,6-10,8%, y su velocidad de detección es casi un 20% más rápida que los métodos reportados previamente. Además, puede lograr una velocidad de procesamiento de aproximadamente 26 FPS y un AP del 87.43% cuando se implanta en una sola CPU, por lo que cumple completamente con el requisito de detección en tiempo real.
Descripción
La detección de peatones ha atraído gran atención en la investigación en videovigilancia, estadísticas de tráfico y especialmente en la conducción autónoma. Hasta la fecha, casi todas las soluciones de detección de peatones se derivan de sensores de imagen basados en fotogramas convencionales con velocidad de reacción limitada y alta redundancia de datos. El sensor de visión dinámica (DVS), inspirado en las retinas biológicas, captura eficientemente la información visual con eventos dispersos y asíncronos en lugar de fotogramas densos y sincrónicos. Puede eliminar la transmisión de datos redundantes y evitar el desenfoque por movimiento o la fuga de datos en aplicaciones de imágenes de alta velocidad. Sin embargo, generalmente es impráctico aplicar directamente los flujos de eventos a algoritmos convencionales de detección de objetos. Para este problema, primero proponemos un nuevo método de conversión de eventos a fotogramas integrando las características inherentes de los eventos de manera más eficiente. Además, diseñamos una red de extracción de características mejorada que puede reutilizar características intermedias para reducir aún más el esfuerzo computacional. Evaluamos el rendimiento de nuestro método propuesto en un conjunto de datos personalizado que contiene múltiples escenas de peatones del mundo real. Los resultados indican que nuestro método propuesto aumentó la precisión de detección de peatones en aproximadamente un 5,6-10,8%, y su velocidad de detección es casi un 20% más rápida que los métodos reportados previamente. Además, puede lograr una velocidad de procesamiento de aproximadamente 26 FPS y un AP del 87.43% cuando se implanta en una sola CPU, por lo que cumple completamente con el requisito de detección en tiempo real.