Detección de cabeza basada en red de extracción de características DR y módulo de convolución dilatada mixta
Autores: Liu, Junwen; Zhang, Yongjun; Xie, Jianbin; Wei, Yan; Wang, Zewei; Niu, Mengjia
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de cabeza basada en red de extracción de características DR y módulo de convolución dilatada mixta
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de peatones
Problemas de oclusión
Detección de cabezas
Red neuronal
Capas convolucionales
Objetivos pequeños
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
La detección de peatones para escenas complejas sufre de problemas de oclusión de peatones, como las oclusiones entre peatones. Como es bien sabido, en comparación con la variabilidad del cuerpo humano, la forma de la cabeza humana y los hombros cambia mínimamente y tiene una alta estabilidad. Por lo tanto, la detección de la cabeza es un área de investigación importante en el campo de la detección de peatones. La invarianza translacional de la red neural nos permite diseñar una red neural convolucional profunda, lo que significa que, incluso si cambia la apariencia y la ubicación del objetivo, aún puede ser reconocido de manera efectiva. Sin embargo, los problemas de invarianza de escala y altas tasas de detección errónea para objetivos pequeños todavía existen. En este artículo, se propone una red de extracción de características DR-Net basada en Darknet-53 para mejorar la tasa de transmisión de información entre capas convolucionales y extraer más información semántica. Además, se incrusta el MDC (convolución dilatada mixta) con diferentes tasas de muestreo de convolución dilatada para mejorar la tasa de detección de objetivos pequeños. Evaluamos nuestro método en tres conjuntos de datos disponibles públicamente y obtuvimos excelentes resultados. El valor de AP (Precisión Promedio) en el conjunto de datos Brainwash, el conjunto de datos HollywoodHeads y el conjunto de datos SCUT-HEAD alcanzó el 92.1%, 84.8% y 90% respectivamente.
Descripción
La detección de peatones para escenas complejas sufre de problemas de oclusión de peatones, como las oclusiones entre peatones. Como es bien sabido, en comparación con la variabilidad del cuerpo humano, la forma de la cabeza humana y los hombros cambia mínimamente y tiene una alta estabilidad. Por lo tanto, la detección de la cabeza es un área de investigación importante en el campo de la detección de peatones. La invarianza translacional de la red neural nos permite diseñar una red neural convolucional profunda, lo que significa que, incluso si cambia la apariencia y la ubicación del objetivo, aún puede ser reconocido de manera efectiva. Sin embargo, los problemas de invarianza de escala y altas tasas de detección errónea para objetivos pequeños todavía existen. En este artículo, se propone una red de extracción de características DR-Net basada en Darknet-53 para mejorar la tasa de transmisión de información entre capas convolucionales y extraer más información semántica. Además, se incrusta el MDC (convolución dilatada mixta) con diferentes tasas de muestreo de convolución dilatada para mejorar la tasa de detección de objetivos pequeños. Evaluamos nuestro método en tres conjuntos de datos disponibles públicamente y obtuvimos excelentes resultados. El valor de AP (Precisión Promedio) en el conjunto de datos Brainwash, el conjunto de datos HollywoodHeads y el conjunto de datos SCUT-HEAD alcanzó el 92.1%, 84.8% y 90% respectivamente.