Algoritmo de detección de texto en escenas complejas basado en aprendizaje profundo para imágenes arquitectónicas
Autores: Sun, Weiwei; Wang, Huiqian; Lu, Yi; Luo, Jiasai; Liu, Ting; Lin, Jinzhao; Pang, Yu; Zhang, Guo
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmo de detección de texto en escenas complejas basado en aprendizaje profundo para imágenes arquitectónicas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Ciudades inteligentes
Información de texto
Recuperación de imágenes
Reconocimiento de matrículas
Algoritmo detector EAST
Texto inclinado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
Con la llegada de las ciudades inteligentes, la información textual en una imagen puede ser ubicada y reconocida con precisión, y luego aplicada a los campos de traducción instantánea, recuperación de imágenes, reconocimiento de información en superficies de tarjetas y reconocimiento de matrículas. Así, la vida y el trabajo de las personas se volverán más convenientes y cómodos. Debido a las variadas orientaciones, ángulos y formas del texto, identificar las características textuales en las imágenes es un desafío. Por lo tanto, proponemos un algoritmo detector EAST mejorado para detectar y reconocer texto inclinado en imágenes. El algoritmo propuesto utiliza aprendizaje por refuerzo para entrenar un controlador de red neuronal recurrente. Se selecciona la estructura óptima de red neuronal convolucional completa, y se extraen características de texto a múltiples escalas. Después de importar esta información al módulo de salida, se utiliza el algoritmo Generalized Intersection over Union para mejorar el efecto de regresión del cuadro delimitador del texto. Luego, la función de pérdida se ajusta para garantizar un equilibrio entre las clases de muestras positivas y negativas antes de emitir los resultados mejorados de detección de texto. Los resultados experimentales indican que el algoritmo propuesto puede abordar el problema de la homogeneización de categorías y mejorar la baja tasa de recuperación en la detección de objetivos. En comparación con otros algoritmos de detección de imágenes, el algoritmo propuesto puede identificar mejor texto inclinado en imágenes de escenas naturales. Finalmente, su capacidad para reconocer texto en entornos complejos también es excelente.
Descripción
Con la llegada de las ciudades inteligentes, la información textual en una imagen puede ser ubicada y reconocida con precisión, y luego aplicada a los campos de traducción instantánea, recuperación de imágenes, reconocimiento de información en superficies de tarjetas y reconocimiento de matrículas. Así, la vida y el trabajo de las personas se volverán más convenientes y cómodos. Debido a las variadas orientaciones, ángulos y formas del texto, identificar las características textuales en las imágenes es un desafío. Por lo tanto, proponemos un algoritmo detector EAST mejorado para detectar y reconocer texto inclinado en imágenes. El algoritmo propuesto utiliza aprendizaje por refuerzo para entrenar un controlador de red neuronal recurrente. Se selecciona la estructura óptima de red neuronal convolucional completa, y se extraen características de texto a múltiples escalas. Después de importar esta información al módulo de salida, se utiliza el algoritmo Generalized Intersection over Union para mejorar el efecto de regresión del cuadro delimitador del texto. Luego, la función de pérdida se ajusta para garantizar un equilibrio entre las clases de muestras positivas y negativas antes de emitir los resultados mejorados de detección de texto. Los resultados experimentales indican que el algoritmo propuesto puede abordar el problema de la homogeneización de categorías y mejorar la baja tasa de recuperación en la detección de objetivos. En comparación con otros algoritmos de detección de imágenes, el algoritmo propuesto puede identificar mejor texto inclinado en imágenes de escenas naturales. Finalmente, su capacidad para reconocer texto en entornos complejos también es excelente.