Imágenes de UAV para el reconocimiento y detección automática de múltiples elementos de tráfico en carretera
Autores: Huang, Liang; Qiu, Mulan; Xu, Anze; Sun, Yu; Zhu, Juanjuan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Imágenes de UAV para el reconocimiento y detección automática de múltiples elementos de tráfico en carretera
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Elementos de tráfico
Tráfico vial
Base de datos de información geográfica
UAVs
Red YOLOv4
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Los elementos del tráfico vial comprenden una parte importante de las carreteras y representan el contenido principal involucrado en la construcción de una base de datos geográfica de información de tráfico básica, que es particularmente importante para el desarrollo de información geográfica de tráfico básica. Sin embargo, aún existen los siguientes problemas para la extracción de elementos de tráfico: datos insuficientes, escenarios complejos, objetivos pequeños e información de elementos incompleta. Por lo tanto, se produce un conjunto de conjuntos de datos de imágenes de teledetección multielemento de tráfico vial obtenidos por vehículos aéreos no tripulados (VANT), y se propone un algoritmo de red YOLOv4 mejorado combinado con un mecanismo de atención para reconocer y detectar automáticamente múltiples elementos del tráfico vial en imágenes de VANT. Primero, se cuenta el rango de escala de diferentes objetos en los conjuntos de datos, y luego se obtiene el tamaño de la caja candidata mediante el método de agrupamiento k-means. En segundo lugar, se utiliza la tecnología de aumento de datos de mosaico para aumentar el número de conjuntos de datos multielemento de tráfico vial entrenados. Luego, al integrar el mecanismo de atención de canal eficiente (ECA) en las dos capas de características efectivas extraídas de la red base YOLOv4 y los resultados de sobremuestreo, la red se centra en la información de características y luego entrena los conjuntos de datos. Al mismo tiempo, se utiliza la función de pérdida de intersección sobre unión completa para considerar la relación geométrica entre el objeto y el objeto de prueba, para resolver el problema de superposición de las cajas de anclaje de elementos de prueba densos yuxtapuestos y reducir la tasa de detección fallida. Finalmente, se calcula la precisión media promedio (mAP) para evaluar el efecto experimental. Los resultados experimentales muestran que el valor de mAP del método propuesto es del 90.45%, lo que es un 15.80% mejor que la precisión promedio de la red YOLOv4 original. La precisión promedio de detección de pasos de cebra, paradas de autobús y espacios de estacionamiento en la carretera se mejora en un 12.52%, 22.82% y 12.09%, respectivamente. Los experimentos de comparación y los experimentos de ablación demostraron que el método propuesto puede realizar el reconocimiento y la detección automáticos de múltiples elementos del tráfico vial, y proporcionar una nueva solución para construir una base de datos geográfica de información de tráfico básica.
Descripción
Los elementos del tráfico vial comprenden una parte importante de las carreteras y representan el contenido principal involucrado en la construcción de una base de datos geográfica de información de tráfico básica, que es particularmente importante para el desarrollo de información geográfica de tráfico básica. Sin embargo, aún existen los siguientes problemas para la extracción de elementos de tráfico: datos insuficientes, escenarios complejos, objetivos pequeños e información de elementos incompleta. Por lo tanto, se produce un conjunto de conjuntos de datos de imágenes de teledetección multielemento de tráfico vial obtenidos por vehículos aéreos no tripulados (VANT), y se propone un algoritmo de red YOLOv4 mejorado combinado con un mecanismo de atención para reconocer y detectar automáticamente múltiples elementos del tráfico vial en imágenes de VANT. Primero, se cuenta el rango de escala de diferentes objetos en los conjuntos de datos, y luego se obtiene el tamaño de la caja candidata mediante el método de agrupamiento k-means. En segundo lugar, se utiliza la tecnología de aumento de datos de mosaico para aumentar el número de conjuntos de datos multielemento de tráfico vial entrenados. Luego, al integrar el mecanismo de atención de canal eficiente (ECA) en las dos capas de características efectivas extraídas de la red base YOLOv4 y los resultados de sobremuestreo, la red se centra en la información de características y luego entrena los conjuntos de datos. Al mismo tiempo, se utiliza la función de pérdida de intersección sobre unión completa para considerar la relación geométrica entre el objeto y el objeto de prueba, para resolver el problema de superposición de las cajas de anclaje de elementos de prueba densos yuxtapuestos y reducir la tasa de detección fallida. Finalmente, se calcula la precisión media promedio (mAP) para evaluar el efecto experimental. Los resultados experimentales muestran que el valor de mAP del método propuesto es del 90.45%, lo que es un 15.80% mejor que la precisión promedio de la red YOLOv4 original. La precisión promedio de detección de pasos de cebra, paradas de autobús y espacios de estacionamiento en la carretera se mejora en un 12.52%, 22.82% y 12.09%, respectivamente. Los experimentos de comparación y los experimentos de ablación demostraron que el método propuesto puede realizar el reconocimiento y la detección automáticos de múltiples elementos del tráfico vial, y proporcionar una nueva solución para construir una base de datos geográfica de información de tráfico básica.