Detección de placas de matrícula con redes piramidales de doble característica guiadas por atención en entornos complejos
Autores: Xiong, Yu-Jie; Gao, Yong-Bin; Zhang, Jun-Qing; Ren, Jian-Xin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección de placas de matrícula con redes piramidales de doble característica guiadas por atención en entornos complejos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de placas de matrícula
Redes neuronales convolucionales
Entornos complejos
Pirámide de características duales guiada por atención
Estrategia de posicionamiento en cascada
Red de propuestas de región
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La detección de matrículas juega un papel significativo en los sistemas de transporte inteligente. Las redes neuronales convolucionales han mostrado un rendimiento notable y han avanzado significativamente en la tarea de detección. A pesar de estos logros sobresalientes, la detección de matrículas en entornos complejos sigue siendo una tarea desafiante, debido al fondo ruidoso, entornos impredecibles y formas y tamaños variables de las matrículas. Para mejorar el rendimiento de la detección de matrículas en entornos complejos, proponemos un enfoque novedoso que utiliza una pirámide de características doble guiada por atención y una estrategia de posicionamiento en cascada. Al principio, las características originales de las imágenes se extraen mediante la red residual. Para asegurarnos de que cada mapa de características contenga información semántica de niveles más altos y más bajos, utilizamos un camino ascendente y otro descendente, respectivamente. Mientras tanto, la red de pirámide de características doble guiada por atención propuesta se utiliza para recibir las características extraídas para una fusión de características multinivel. Nuestros módulos de atención propuestos contienen tanto atención espacial como de canal. Los módulos guiados por atención deducen los pesos de atención según las dimensiones de canal y espaciales y multiplican el resultado calculado con la entrada para obtener los mapas de características refinados. Luego, se utiliza una red de propuesta de región para generar las regiones candidatas de las matrículas. Finalmente, se utiliza una red de posicionamiento en cascada para obtener las ubicaciones finales de las matrículas. Para validar la efectividad del método propuesto, realizamos una serie de experimentos en diferentes conjuntos de datos públicos. Los experimentos en AOLP y CCPD validaron la efectividad de nuestro método propuesto.
Descripción
La detección de matrículas juega un papel significativo en los sistemas de transporte inteligente. Las redes neuronales convolucionales han mostrado un rendimiento notable y han avanzado significativamente en la tarea de detección. A pesar de estos logros sobresalientes, la detección de matrículas en entornos complejos sigue siendo una tarea desafiante, debido al fondo ruidoso, entornos impredecibles y formas y tamaños variables de las matrículas. Para mejorar el rendimiento de la detección de matrículas en entornos complejos, proponemos un enfoque novedoso que utiliza una pirámide de características doble guiada por atención y una estrategia de posicionamiento en cascada. Al principio, las características originales de las imágenes se extraen mediante la red residual. Para asegurarnos de que cada mapa de características contenga información semántica de niveles más altos y más bajos, utilizamos un camino ascendente y otro descendente, respectivamente. Mientras tanto, la red de pirámide de características doble guiada por atención propuesta se utiliza para recibir las características extraídas para una fusión de características multinivel. Nuestros módulos de atención propuestos contienen tanto atención espacial como de canal. Los módulos guiados por atención deducen los pesos de atención según las dimensiones de canal y espaciales y multiplican el resultado calculado con la entrada para obtener los mapas de características refinados. Luego, se utiliza una red de propuesta de región para generar las regiones candidatas de las matrículas. Finalmente, se utiliza una red de posicionamiento en cascada para obtener las ubicaciones finales de las matrículas. Para validar la efectividad del método propuesto, realizamos una serie de experimentos en diferentes conjuntos de datos públicos. Los experimentos en AOLP y CCPD validaron la efectividad de nuestro método propuesto.