Mejora de la reconocimiento de caracteres en relieve de ángulo YOLOV5 mediante atención residual multiscale con agrupación seleccionable
Autores: Ying, Shenshun; Fang, Jianhai; Tang, Shaozhang; Bao, Wenzhi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejora de la reconocimiento de caracteres en relieve de ángulo YOLOV5 mediante atención residual multiscale con agrupación seleccionable
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Torres de transmisión de energía
Caracteres estampados
Tecnologías OCR
Red neuronal profunda
YOLOv5
Centros de agrupamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
En el proceso de inteligentización de las torres de transmisión de energía, la identificación automatizada de caracteres estampados es crucial. Actualmente, se utilizan predominantemente métodos manuales, que son demorados, intensivos en mano de obra y propensos a errores. Para caracteres de tamaño pequeño que son incompletos, conectados e irregulares en forma, las tecnologías OCR existentes también tienen dificultades para lograr resultados de reconocimiento satisfactorios. Por lo tanto, se propone un enfoque que utiliza un modelo de red neuronal profunda mejorado para mejorar el rendimiento de reconocimiento de caracteres estampados. Basado en la red principal de YOLOv5, se introduce un mecanismo de codificación de atención residual de múltiples escalas durante el proceso de upsampling para mejorar los pesos de los objetivos de caracteres pequeños e incompletos. Además, se introduce un módulo de centro de iteración mínima de agrupamiento seleccionable para optimizar la selección de centros de agrupamiento e integrar información de múltiples escalas, reduciendo así los errores aleatorios. La verificación experimental muestra que el modelo mejorado reduce significativamente la inestabilidad causada por la selección aleatoria de centros de agrupamiento durante el proceso de agrupamiento, acelera la convergencia del reconocimiento de objetivos pequeños, logra una precisión de reconocimiento del 97.6% y una velocidad de detección de 43 milisegundos en la tarea de reconocimiento de caracteres estampados, y supera significativamente a los modelos existentes Fast-CNN, YOLOv5 y YOLOv6 en términos de rendimiento, mejorando efectivamente la precisión y eficiencia de la identificación automática.
Descripción
En el proceso de inteligentización de las torres de transmisión de energía, la identificación automatizada de caracteres estampados es crucial. Actualmente, se utilizan predominantemente métodos manuales, que son demorados, intensivos en mano de obra y propensos a errores. Para caracteres de tamaño pequeño que son incompletos, conectados e irregulares en forma, las tecnologías OCR existentes también tienen dificultades para lograr resultados de reconocimiento satisfactorios. Por lo tanto, se propone un enfoque que utiliza un modelo de red neuronal profunda mejorado para mejorar el rendimiento de reconocimiento de caracteres estampados. Basado en la red principal de YOLOv5, se introduce un mecanismo de codificación de atención residual de múltiples escalas durante el proceso de upsampling para mejorar los pesos de los objetivos de caracteres pequeños e incompletos. Además, se introduce un módulo de centro de iteración mínima de agrupamiento seleccionable para optimizar la selección de centros de agrupamiento e integrar información de múltiples escalas, reduciendo así los errores aleatorios. La verificación experimental muestra que el modelo mejorado reduce significativamente la inestabilidad causada por la selección aleatoria de centros de agrupamiento durante el proceso de agrupamiento, acelera la convergencia del reconocimiento de objetivos pequeños, logra una precisión de reconocimiento del 97.6% y una velocidad de detección de 43 milisegundos en la tarea de reconocimiento de caracteres estampados, y supera significativamente a los modelos existentes Fast-CNN, YOLOv5 y YOLOv6 en términos de rendimiento, mejorando efectivamente la precisión y eficiencia de la identificación automática.