logo móvil
Contáctanos

Mejora de la reconocimiento de caracteres en relieve de ángulo YOLOV5 mediante atención residual multiscale con agrupación seleccionable

Autores: Ying, Shenshun; Fang, Jianhai; Tang, Shaozhang; Bao, Wenzhi

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Mejora de la reconocimiento de caracteres en relieve de ángulo YOLOV5 mediante atención residual multiscale con agrupación seleccionable


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Torres de transmisión de energía
Caracteres estampados
Tecnologías OCR
Red neuronal profunda
YOLOv5
Centros de agrupamiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 43

Citaciones: Sin citaciones


Descripción
En el proceso de inteligentización de las torres de transmisión de energía, la identificación automatizada de caracteres estampados es crucial. Actualmente, se utilizan predominantemente métodos manuales, que son demorados, intensivos en mano de obra y propensos a errores. Para caracteres de tamaño pequeño que son incompletos, conectados e irregulares en forma, las tecnologías OCR existentes también tienen dificultades para lograr resultados de reconocimiento satisfactorios. Por lo tanto, se propone un enfoque que utiliza un modelo de red neuronal profunda mejorado para mejorar el rendimiento de reconocimiento de caracteres estampados. Basado en la red principal de YOLOv5, se introduce un mecanismo de codificación de atención residual de múltiples escalas durante el proceso de upsampling para mejorar los pesos de los objetivos de caracteres pequeños e incompletos. Además, se introduce un módulo de centro de iteración mínima de agrupamiento seleccionable para optimizar la selección de centros de agrupamiento e integrar información de múltiples escalas, reduciendo así los errores aleatorios. La verificación experimental muestra que el modelo mejorado reduce significativamente la inestabilidad causada por la selección aleatoria de centros de agrupamiento durante el proceso de agrupamiento, acelera la convergencia del reconocimiento de objetivos pequeños, logra una precisión de reconocimiento del 97.6% y una velocidad de detección de 43 milisegundos en la tarea de reconocimiento de caracteres estampados, y supera significativamente a los modelos existentes Fast-CNN, YOLOv5 y YOLOv6 en términos de rendimiento, mejorando efectivamente la precisión y eficiencia de la identificación automática.

Otros recursos que podrían interesarte

Temas Virtualpro