Un red neuronal convolucional paralelo para la detección de peatones
Autores: Zhu, Mengya; Wu, Yiquan
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un red neuronal convolucional paralelo para la detección de peatones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de peatones
Aplicaciones basadas en visión
Parámetros del modelo
ParallelNet
Características semánticas de alto nivel
Módulo Fire
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
La detección de peatones es una tarea crucial en muchas aplicaciones basadas en visión, como la vigilancia por video, el análisis de la actividad humana y la conducción autónoma. Recientemente, la mayoría de los marcos de detección de peatones existentes solo se centran en la precisión de detección o en los parámetros del modelo. Sin embargo, cómo equilibrar la precisión de detección y los parámetros del modelo sigue siendo un problema abierto para la aplicación práctica de la detección de peatones. En este documento, proponemos un marco paralelo y ligero para la detección de peatones, llamado ParallelNet. ParallelNet consta de cuatro ramas, cada una aprende diferentes características semánticas de alto nivel. Las fusionamos en un mapa de características como representación final. Posteriormente, se emplea el módulo Fire, que incluye las partes Squeeze y Expand, para reducir los parámetros del modelo. Aquí, reemplazamos algunos módulos de convolución en la estructura principal con módulos Fire. Finalmente, la pérdida focal se introduce en el ParallelNet para el entrenamiento de extremo a extremo. Los resultados experimentales en el conjunto de datos Caltech-Zhang y el conjunto de datos KITTI muestran que: En comparación con la red de una sola rama, como ResNet y SqueezeNet, ParallelNet ha mejorado la precisión de detección con menos parámetros del modelo y menos operaciones de punto flotante de gigabytes (GFLOPs).
Descripción
La detección de peatones es una tarea crucial en muchas aplicaciones basadas en visión, como la vigilancia por video, el análisis de la actividad humana y la conducción autónoma. Recientemente, la mayoría de los marcos de detección de peatones existentes solo se centran en la precisión de detección o en los parámetros del modelo. Sin embargo, cómo equilibrar la precisión de detección y los parámetros del modelo sigue siendo un problema abierto para la aplicación práctica de la detección de peatones. En este documento, proponemos un marco paralelo y ligero para la detección de peatones, llamado ParallelNet. ParallelNet consta de cuatro ramas, cada una aprende diferentes características semánticas de alto nivel. Las fusionamos en un mapa de características como representación final. Posteriormente, se emplea el módulo Fire, que incluye las partes Squeeze y Expand, para reducir los parámetros del modelo. Aquí, reemplazamos algunos módulos de convolución en la estructura principal con módulos Fire. Finalmente, la pérdida focal se introduce en el ParallelNet para el entrenamiento de extremo a extremo. Los resultados experimentales en el conjunto de datos Caltech-Zhang y el conjunto de datos KITTI muestran que: En comparación con la red de una sola rama, como ResNet y SqueezeNet, ParallelNet ha mejorado la precisión de detección con menos parámetros del modelo y menos operaciones de punto flotante de gigabytes (GFLOPs).