logo móvil
Contáctanos

Algoritmo de detección de texto en escenas complejas basado en aprendizaje profundo para imágenes arquitectónicas

Autores: Sun, Weiwei; Wang, Huiqian; Lu, Yi; Luo, Jiasai; Liu, Ting; Lin, Jinzhao; Pang, Yu; Zhang, Guo

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Algoritmo de detección de texto en escenas complejas basado en aprendizaje profundo para imágenes arquitectónicas


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Ciudades inteligentes
Información de texto
Recuperación de imágenes
Reconocimiento de matrículas
Algoritmo detector EAST
Texto inclinado

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 41

Citaciones: Sin citaciones


Descripción
Con la llegada de las ciudades inteligentes, la información textual en una imagen puede ser ubicada y reconocida con precisión, y luego aplicada a los campos de traducción instantánea, recuperación de imágenes, reconocimiento de información en superficies de tarjetas y reconocimiento de matrículas. Así, la vida y el trabajo de las personas se volverán más convenientes y cómodos. Debido a las variadas orientaciones, ángulos y formas del texto, identificar las características textuales en las imágenes es un desafío. Por lo tanto, proponemos un algoritmo detector EAST mejorado para detectar y reconocer texto inclinado en imágenes. El algoritmo propuesto utiliza aprendizaje por refuerzo para entrenar un controlador de red neuronal recurrente. Se selecciona la estructura óptima de red neuronal convolucional completa, y se extraen características de texto a múltiples escalas. Después de importar esta información al módulo de salida, se utiliza el algoritmo Generalized Intersection over Union para mejorar el efecto de regresión del cuadro delimitador del texto. Luego, la función de pérdida se ajusta para garantizar un equilibrio entre las clases de muestras positivas y negativas antes de emitir los resultados mejorados de detección de texto. Los resultados experimentales indican que el algoritmo propuesto puede abordar el problema de la homogeneización de categorías y mejorar la baja tasa de recuperación en la detección de objetivos. En comparación con otros algoritmos de detección de imágenes, el algoritmo propuesto puede identificar mejor texto inclinado en imágenes de escenas naturales. Finalmente, su capacidad para reconocer texto en entornos complejos también es excelente.

Otros recursos que podrían interesarte

Temas Virtualpro