logo móvil
Contáctanos

CA-STD: Detección de Texto en Escenas en Forma Arbitraria Basada en Atención Condicional

Autores: Wu, Xing; Qi, Yangyang; Song, Jun; Yao, Junfeng; Wang, Yanzhong; Liu, Yang; Han, Yuexing; Qian, Quan

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

CA-STD: Detección de Texto en Escenas en Forma Arbitraria Basada en Atención Condicional


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Detección de texto
CA-STD
Módulo de refinamiento de características
Mecanismo de atención condicional
Agregación de información de contorno
Precisión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La detección de texto en escenas (STD) es crítica para obtener información textual de escenas naturales, sirviendo para la conducción automatizada y la vigilancia de seguridad. Sin embargo, los métodos existentes de detección de texto no son suficientes al tratar con la variación en las curvaturas, orientaciones y relaciones de aspecto del texto en fondos complejos. Para enfrentar este desafío, proponemos un método llamado CA-STD para detectar texto de forma arbitraria contra un fondo complicado. En primer lugar, se propone un Módulo de Refinamiento de Características (FRM) para mejorar la representación de características. Además, se propone un mecanismo de atención condicional no solo para desacoplar la información espacial y textual de las imágenes de texto en escena, sino también para modelar la relación entre diferentes vectores de características. Finalmente, se presenta la Agregación de Información de Contorno (CIA) para enriquecer la representación de características de los contornos de texto al considerar la topología circular y la información semántica simultáneamente para obtener las curvas de detección con formas arbitrarias. El método CA-STD propuesto se evalúa en diferentes conjuntos de datos con experimentos extensos. Por un lado, el CA-STD supera a los métodos de última generación y logra un 82.9 en precisión en el conjunto de datos de TotalText. Por otro lado, el método tiene un mejor rendimiento que los métodos de última generación y alcanza una puntuación F1 de 83.8 en el conjunto de datos de CTW-1500. El análisis cuantitativo y cualitativo demuestra que el CA-STD puede detectar texto en escena de formas variables de manera efectiva.

Otros recursos que podrían interesarte

Temas Virtualpro