Un marco de aprendizaje profundo de súper resolución para el reconocimiento de matrículas en un sistema de vigilancia
Autores: Tsai, Pei-Fen; Shiu, Jia-Yin; Yuan, Shyan-Ming
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un marco de aprendizaje profundo de súper resolución para el reconocimiento de matrículas en un sistema de vigilancia
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Placas de matrícula
Aprendizaje profundo
Super resolución
Precisión de OCR
Conjunto de datos
Rendimiento de reconocimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Reconocer matrículas de baja resolución de escenas del mundo real sigue siendo una tarea desafiante. Aunque los métodos de superresolución basados en aprendizaje profundo se han aplicado ampliamente, la mayoría de los conjuntos de datos existentes se basan en imágenes degradadas artificialmente, y las métricas de calidad comunes tienen poca correlación con la precisión del OCR. Construimos un nuevo conjunto de datos emparejados de matrículas de baja y alta resolución a partir de videos de cámaras de tablero y proponemos un marco de superresolución especializado para el reconocimiento de matrículas. Solo se utilizan imágenes de baja resolución con una precisión de OCR >=5 para garantizar suficiente información de características para un aprendizaje perceptual efectivo. Analizamos las funciones de pérdida existentes e introducimos dos nuevas pérdidas perceptuales, una basada en CNN y otra basada en Transformer. Nuestro enfoque mejora el rendimiento de reconocimiento, logrando una precisión de OCR promedio del 85.14%.
Descripción
Reconocer matrículas de baja resolución de escenas del mundo real sigue siendo una tarea desafiante. Aunque los métodos de superresolución basados en aprendizaje profundo se han aplicado ampliamente, la mayoría de los conjuntos de datos existentes se basan en imágenes degradadas artificialmente, y las métricas de calidad comunes tienen poca correlación con la precisión del OCR. Construimos un nuevo conjunto de datos emparejados de matrículas de baja y alta resolución a partir de videos de cámaras de tablero y proponemos un marco de superresolución especializado para el reconocimiento de matrículas. Solo se utilizan imágenes de baja resolución con una precisión de OCR >=5 para garantizar suficiente información de características para un aprendizaje perceptual efectivo. Analizamos las funciones de pérdida existentes e introducimos dos nuevas pérdidas perceptuales, una basada en CNN y otra basada en Transformer. Nuestro enfoque mejora el rendimiento de reconocimiento, logrando una precisión de OCR promedio del 85.14%.