Ra-yolov8: un método mejorado de detección de texto de sello Yolov8
Autores: Sun, Han; Tan, Chaohong; Pang, Si; Wang, Hancheng; Huang, Baohua
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ra-yolov8: un método mejorado de detección de texto de sello Yolov8
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Sellos electrónicos
Modelo RA-YOLOv8
Módulo RFEMA
Módulo AKConv
Función de pérdida de regresión de cuadro delimitador
Rendimiento de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Para detectar texto de sellos electrónicos que presentan interferencia de fondo significativa, desenfoque, superposición de texto y curvatura, se desarrolló un modelo mejorado de YOLOv8 llamado RA-YOLOv8. El modelo se basa principalmente en YOLOv8, con estructuras optimizadas en su espina dorsal y cuello. Se introduce el módulo de atención de campo receptivo y atención eficiente a múltiples escalas (RFEMA) en la espina dorsal. La capacidad del modelo para extraer e integrar características locales y globales se ve mejorada al combinar la atención en la característica espacial del campo receptivo del módulo de atención de campo receptivo y atención de coordenadas (RFCA) y el aprendizaje cruzado espacial del módulo de atención eficiente a múltiples escalas (EMA). Se incorpora el módulo de convolución de núcleo alterable (AKConv) en el cuello, mejorando la precisión de detección del modelo de texto curvo al ajustar dinámicamente la posición de muestreo. Además, para impulsar el rendimiento de detección del modelo, la función de pérdida original se reemplaza por la función de pérdida de regresión de cuadro del punto mínimo de distancia de intersección sobre unión (MPDIoU). Los resultados experimentales demuestran que RA-YOLOv8 supera a YOLOv8 en cuanto a precisión, recall y valor F1, con mejoras del 0,4%, 1,6% y 1,03%, respectivamente, validando su eficacia y utilidad en la detección de texto en sellos.
Descripción
Para detectar texto de sellos electrónicos que presentan interferencia de fondo significativa, desenfoque, superposición de texto y curvatura, se desarrolló un modelo mejorado de YOLOv8 llamado RA-YOLOv8. El modelo se basa principalmente en YOLOv8, con estructuras optimizadas en su espina dorsal y cuello. Se introduce el módulo de atención de campo receptivo y atención eficiente a múltiples escalas (RFEMA) en la espina dorsal. La capacidad del modelo para extraer e integrar características locales y globales se ve mejorada al combinar la atención en la característica espacial del campo receptivo del módulo de atención de campo receptivo y atención de coordenadas (RFCA) y el aprendizaje cruzado espacial del módulo de atención eficiente a múltiples escalas (EMA). Se incorpora el módulo de convolución de núcleo alterable (AKConv) en el cuello, mejorando la precisión de detección del modelo de texto curvo al ajustar dinámicamente la posición de muestreo. Además, para impulsar el rendimiento de detección del modelo, la función de pérdida original se reemplaza por la función de pérdida de regresión de cuadro del punto mínimo de distancia de intersección sobre unión (MPDIoU). Los resultados experimentales demuestran que RA-YOLOv8 supera a YOLOv8 en cuanto a precisión, recall y valor F1, con mejoras del 0,4%, 1,6% y 1,03%, respectivamente, validando su eficacia y utilidad en la detección de texto en sellos.