CA-STD: Detección de Texto en Escenas en Forma Arbitraria Basada en Atención Condicional
Autores: Wu, Xing; Qi, Yangyang; Song, Jun; Yao, Junfeng; Wang, Yanzhong; Liu, Yang; Han, Yuexing; Qian, Quan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
CA-STD: Detección de Texto en Escenas en Forma Arbitraria Basada en Atención Condicional
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección de texto
CA-STD
Módulo de refinamiento de características
Mecanismo de atención condicional
Agregación de información de contorno
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de texto en escenas (STD) es crítica para obtener información textual de escenas naturales, sirviendo para la conducción automatizada y la vigilancia de seguridad. Sin embargo, los métodos existentes de detección de texto no son suficientes al tratar con la variación en las curvaturas, orientaciones y relaciones de aspecto del texto en fondos complejos. Para enfrentar este desafío, proponemos un método llamado CA-STD para detectar texto de forma arbitraria contra un fondo complicado. En primer lugar, se propone un Módulo de Refinamiento de Características (FRM) para mejorar la representación de características. Además, se propone un mecanismo de atención condicional no solo para desacoplar la información espacial y textual de las imágenes de texto en escena, sino también para modelar la relación entre diferentes vectores de características. Finalmente, se presenta la Agregación de Información de Contorno (CIA) para enriquecer la representación de características de los contornos de texto al considerar la topología circular y la información semántica simultáneamente para obtener las curvas de detección con formas arbitrarias. El método CA-STD propuesto se evalúa en diferentes conjuntos de datos con experimentos extensos. Por un lado, el CA-STD supera a los métodos de última generación y logra un 82.9 en precisión en el conjunto de datos de TotalText. Por otro lado, el método tiene un mejor rendimiento que los métodos de última generación y alcanza una puntuación F1 de 83.8 en el conjunto de datos de CTW-1500. El análisis cuantitativo y cualitativo demuestra que el CA-STD puede detectar texto en escena de formas variables de manera efectiva.
Descripción
La detección de texto en escenas (STD) es crítica para obtener información textual de escenas naturales, sirviendo para la conducción automatizada y la vigilancia de seguridad. Sin embargo, los métodos existentes de detección de texto no son suficientes al tratar con la variación en las curvaturas, orientaciones y relaciones de aspecto del texto en fondos complejos. Para enfrentar este desafío, proponemos un método llamado CA-STD para detectar texto de forma arbitraria contra un fondo complicado. En primer lugar, se propone un Módulo de Refinamiento de Características (FRM) para mejorar la representación de características. Además, se propone un mecanismo de atención condicional no solo para desacoplar la información espacial y textual de las imágenes de texto en escena, sino también para modelar la relación entre diferentes vectores de características. Finalmente, se presenta la Agregación de Información de Contorno (CIA) para enriquecer la representación de características de los contornos de texto al considerar la topología circular y la información semántica simultáneamente para obtener las curvas de detección con formas arbitrarias. El método CA-STD propuesto se evalúa en diferentes conjuntos de datos con experimentos extensos. Por un lado, el CA-STD supera a los métodos de última generación y logra un 82.9 en precisión en el conjunto de datos de TotalText. Por otro lado, el método tiene un mejor rendimiento que los métodos de última generación y alcanza una puntuación F1 de 83.8 en el conjunto de datos de CTW-1500. El análisis cuantitativo y cualitativo demuestra que el CA-STD puede detectar texto en escena de formas variables de manera efectiva.