Un modelo basado en secuencias de memoria corta para el reconocimiento de lectura de longitud variable de instrumentos digitales de varios tipos en escenarios industriales
Autores: Wei, Shenghan; Li, Xiang; Yao, Yong; Yang, Suixian
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo basado en secuencias de memoria corta para el reconocimiento de lectura de longitud variable de instrumentos digitales de varios tipos en escenarios industriales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aplicación práctica
Reconocimiento óptico de caracteres
Instrumentos digitales
Reconocimiento de lectura de longitud variable
Módulo de secuencia basado en RNN
Extractor de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Como una aplicación práctica del Reconocimiento Óptico de Caracteres (OCR) para la situación digital, el reconocimiento de instrumentos digitales es significativo para lograr la gestión automática de información en escenarios industriales reales. Sin embargo, a diferencia de la tarea normal de reconocimiento digital como el reconocimiento de placas de matrícula, reconocimiento de CAPTCHA y reconocimiento de dígitos escritos a mano, la tarea de reconocimiento de instrumentos digitales de varios tipos enfrenta mayores desafíos debido a que las cadenas de lectura son de longitud variable con diferentes fuentes, espaciados y relaciones de aspecto. Para superar esta limitación, proponemos un nuevo modelo basado en secuencias de memoria corta para el reconocimiento de lectura de longitud variable. Primero, involucramos una estrategia de conexión rápida en una estructura convolucional tradicional para formar un extractor de características que capture características efectivas de caracteres con diferentes fuentes de imágenes de instrumentos digitales de varios tipos. Luego, aplicamos un módulo de secuencia basado en RNN, que fortalece las dependencias a corta distancia al tiempo que reduce la memoria de tendencia a larga distancia de la cadena de lectura, para mejorar en gran medida la robustez y generalización del modelo para datos invisibles. Finalmente, se propone un nuevo modelo basado en secuencias de memoria corta que consta de un extractor de características, un módulo de secuencia basado en RNN y el CTC, para el reconocimiento de lectura de longitud variable de instrumentos digitales de varios tipos. Los resultados experimentales muestran que este método es efectivo en la tarea de reconocimiento de lectura de instrumentos de longitud variable, especialmente para datos invisibles, lo que demuestra que nuestro método tiene una generalización y robustez sobresalientes en aplicaciones industriales reales.
Descripción
Como una aplicación práctica del Reconocimiento Óptico de Caracteres (OCR) para la situación digital, el reconocimiento de instrumentos digitales es significativo para lograr la gestión automática de información en escenarios industriales reales. Sin embargo, a diferencia de la tarea normal de reconocimiento digital como el reconocimiento de placas de matrícula, reconocimiento de CAPTCHA y reconocimiento de dígitos escritos a mano, la tarea de reconocimiento de instrumentos digitales de varios tipos enfrenta mayores desafíos debido a que las cadenas de lectura son de longitud variable con diferentes fuentes, espaciados y relaciones de aspecto. Para superar esta limitación, proponemos un nuevo modelo basado en secuencias de memoria corta para el reconocimiento de lectura de longitud variable. Primero, involucramos una estrategia de conexión rápida en una estructura convolucional tradicional para formar un extractor de características que capture características efectivas de caracteres con diferentes fuentes de imágenes de instrumentos digitales de varios tipos. Luego, aplicamos un módulo de secuencia basado en RNN, que fortalece las dependencias a corta distancia al tiempo que reduce la memoria de tendencia a larga distancia de la cadena de lectura, para mejorar en gran medida la robustez y generalización del modelo para datos invisibles. Finalmente, se propone un nuevo modelo basado en secuencias de memoria corta que consta de un extractor de características, un módulo de secuencia basado en RNN y el CTC, para el reconocimiento de lectura de longitud variable de instrumentos digitales de varios tipos. Los resultados experimentales muestran que este método es efectivo en la tarea de reconocimiento de lectura de instrumentos de longitud variable, especialmente para datos invisibles, lo que demuestra que nuestro método tiene una generalización y robustez sobresalientes en aplicaciones industriales reales.