Método de Detección de Vehículos y Peatones Basado en Agrupación de Pirámide Espacial y Mecanismo de Atención
Autores: Guo, Mingtao; Xue, Donghui; Li, Peng; Xu, He
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Método de Detección de Vehículos y Peatones Basado en Agrupación de Pirámide Espacial y Mecanismo de Atención
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección de objetos
Vehículos
Peatones
Aplicaciones de piloto automático
YOLOv3-promover
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos para vehículos y peatones es extremadamente difícil de lograr en aplicaciones de piloto automático para el Internet de los vehículos, y es una tarea que requiere la capacidad de localizar e identificar objetivos más pequeños incluso en entornos complejos. Este documento propone una red de detección de objetos de una sola etapa (YOLOv3-promote) para la detección de vehículos y peatones en entornos complejos en ciudades, que mejora la versión tradicional You Only Look Once versión 3 (YOLOv3). Primero, se utiliza la agrupación en pirámide espacial para fusionar características locales y globales en una imagen para enriquecer mejor la capacidad de expresión del mapa de características y detectar de manera más efectiva objetivos con grandes diferencias de tamaño en la imagen; en segundo lugar, se añade un mecanismo de atención al mapa de características para ponderar cada canal, lo que permite realzar características clave y eliminar características redundantes, lo que fortalece la capacidad de la red de características para discriminar entre objetos objetivo y fondos; por último, la caja de anclaje derivada del algoritmo de agrupamiento K-means se ajusta a la caja de predicción final para completar la ubicación e identificación de vehículos y peatones objetivo. Los resultados experimentales muestran que el método propuesto logró 91.4 mAP (precisión media promedio), 83.2 puntuación F1 y 43.7 fotogramas por segundo (FPS) en el conjunto de datos KITTI (Instituto de Tecnología de Karlsruhe e Instituto Tecnológico de Toyota), y el rendimiento de detección fue superior al del algoritmo convencional YOLOv3 en términos de precisión y velocidad.
Descripción
La detección de objetos para vehículos y peatones es extremadamente difícil de lograr en aplicaciones de piloto automático para el Internet de los vehículos, y es una tarea que requiere la capacidad de localizar e identificar objetivos más pequeños incluso en entornos complejos. Este documento propone una red de detección de objetos de una sola etapa (YOLOv3-promote) para la detección de vehículos y peatones en entornos complejos en ciudades, que mejora la versión tradicional You Only Look Once versión 3 (YOLOv3). Primero, se utiliza la agrupación en pirámide espacial para fusionar características locales y globales en una imagen para enriquecer mejor la capacidad de expresión del mapa de características y detectar de manera más efectiva objetivos con grandes diferencias de tamaño en la imagen; en segundo lugar, se añade un mecanismo de atención al mapa de características para ponderar cada canal, lo que permite realzar características clave y eliminar características redundantes, lo que fortalece la capacidad de la red de características para discriminar entre objetos objetivo y fondos; por último, la caja de anclaje derivada del algoritmo de agrupamiento K-means se ajusta a la caja de predicción final para completar la ubicación e identificación de vehículos y peatones objetivo. Los resultados experimentales muestran que el método propuesto logró 91.4 mAP (precisión media promedio), 83.2 puntuación F1 y 43.7 fotogramas por segundo (FPS) en el conjunto de datos KITTI (Instituto de Tecnología de Karlsruhe e Instituto Tecnológico de Toyota), y el rendimiento de detección fue superior al del algoritmo convencional YOLOv3 en términos de precisión y velocidad.