Método de detección y reconocimiento de placas de matrícula de extremo a extremo basado en aprendizaje profundo
Autores: Ma, Zongfang; Wu, Zheping; Cao, Yonggen
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Método de detección y reconocimiento de placas de matrícula de extremo a extremo basado en aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Robot inteligente
Conducción automática
Detección de matrículas
Computación de borde móvil
Aprendizaje profundo
Red LPDR
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
En el campo de los robots inteligentes y la conducción automática, la tarea de detección y reconocimiento de matrículas (LPDR) es realizada por chips de computación móvil en el borde (MEC) en lugar de servidores de unidades de procesamiento gráfico (GPU) grandes. Para este tipo de chip MEC de capacidad de cálculo pequeña, se necesita con urgencia una red LPDR ligera con buen rendimiento en precisión y velocidad. Los métodos de reconocimiento de LP de aprendizaje profundo (DL) contemporáneos utilizan estrategias de dos pasos (es decir, red de detección y red de reconocimiento) o de tres pasos (es decir, red de detección, método de segmentación de caracteres y red de reconocimiento), lo que resultará en cargar dos redes en el chip MEC e insertar muchos pasos complejos. Para superar este problema, este estudio presenta una red LPDR ligera de extremo a extremo. En primer lugar, esta red adopta la estructura ligera VGG16 para reducir el número de mapas de características y agrega atención de canal en las capas tercera, quinta y octava. Puede reducir el número de parámetros del modelo sin perder la precisión de la predicción. En segundo lugar, se añade la predicción del ángulo rotado de la LP, lo que puede mejorar la coincidencia entre el cuadro delimitador y la LP. En tercer lugar, la parte de la LP del mapa de características se recorta por la posición relativa del módulo de detección, y se realizan el agrupamiento de regiones de interés (ROI) y la fusión. Luego se utilizan siete clasificadores para identificar los caracteres de la LP a través de la característica de fusión del tercer paso. Por último, los experimentos muestran que la precisión de la red propuesta alcanza el 91.5 y que la velocidad alcanza los 63 fps. En los chips de computación móvil HiSilicon 3516DV300 y Rockchip Rv1126, la velocidad de la red ha sido probada para 15 fps.
Descripción
En el campo de los robots inteligentes y la conducción automática, la tarea de detección y reconocimiento de matrículas (LPDR) es realizada por chips de computación móvil en el borde (MEC) en lugar de servidores de unidades de procesamiento gráfico (GPU) grandes. Para este tipo de chip MEC de capacidad de cálculo pequeña, se necesita con urgencia una red LPDR ligera con buen rendimiento en precisión y velocidad. Los métodos de reconocimiento de LP de aprendizaje profundo (DL) contemporáneos utilizan estrategias de dos pasos (es decir, red de detección y red de reconocimiento) o de tres pasos (es decir, red de detección, método de segmentación de caracteres y red de reconocimiento), lo que resultará en cargar dos redes en el chip MEC e insertar muchos pasos complejos. Para superar este problema, este estudio presenta una red LPDR ligera de extremo a extremo. En primer lugar, esta red adopta la estructura ligera VGG16 para reducir el número de mapas de características y agrega atención de canal en las capas tercera, quinta y octava. Puede reducir el número de parámetros del modelo sin perder la precisión de la predicción. En segundo lugar, se añade la predicción del ángulo rotado de la LP, lo que puede mejorar la coincidencia entre el cuadro delimitador y la LP. En tercer lugar, la parte de la LP del mapa de características se recorta por la posición relativa del módulo de detección, y se realizan el agrupamiento de regiones de interés (ROI) y la fusión. Luego se utilizan siete clasificadores para identificar los caracteres de la LP a través de la característica de fusión del tercer paso. Por último, los experimentos muestran que la precisión de la red propuesta alcanza el 91.5 y que la velocidad alcanza los 63 fps. En los chips de computación móvil HiSilicon 3516DV300 y Rockchip Rv1126, la velocidad de la red ha sido probada para 15 fps.