Un método de reconocimiento de automóviles de grano fino basado en una red de atención ligera y ajuste fino regularizado
Autores: Zhang, Cheng; Li, Qiaochu; Liu, Chang; Zhang, Yi; Zhao, Ding; Ji, Chao; Wang, Jin
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un método de reconocimiento de automóviles de grano fino basado en una red de atención ligera y ajuste fino regularizado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento de multas de coches
Clasificación de imágenes detallada
Red de atención ligera
Ajuste fino regularizado
Arquitectura CNN
Módulo de atención híbrido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
El reconocimiento de multas de coches es un escenario típico para la clasificación de imágenes detalladas, que tiene un gran valor de investigación y aplicación tanto en campos civiles como militares. Sin embargo, la investigación actual sobre la clasificación detallada suele limitarse a mejorar la precisión de los modelos de clasificación, ignorando la necesidad de aplicaciones ligeras y eficientes en aplicaciones prácticas, lo que resulta en una desconexión con la realidad. En este documento, se propone un método de reconocimiento detallado de coches basado en una red de atención ligera y ajuste fino regularizado. Basándose en la arquitectura de red neuronal convolucional (CNN) ligera y de alto rendimiento MobileNet V3, se diseña una arquitectura de CNN mejorada HAM-MobileNet que incluye un módulo de atención híbrido. Se adopta una estrategia de ajuste fino regularizado que incluye restricciones de correlación. Al ajustar finamente el HAM-MobileNet, se puede lograr una clasificación precisa de imágenes de coches. Los resultados experimentales en el conjunto de datos de coches de Stanford muestran que el método propuesto alcanza una tasa de precisión del 84.6%, que es el nivel más alto entre todas las arquitecturas de CNN ligeras y es comparable a las arquitecturas de CNN no ligeras. Los resultados de visualización muestran que el módulo de atención híbrido propuesto puede hacer que el modelo de red se enfoque más en los objetos objetivo con clases consistentes, suprima los fondos irrelevantes para la tarea y otros ruidos, y mejore la capacidad de aprendizaje y generalización del modelo de red.
Descripción
El reconocimiento de multas de coches es un escenario típico para la clasificación de imágenes detalladas, que tiene un gran valor de investigación y aplicación tanto en campos civiles como militares. Sin embargo, la investigación actual sobre la clasificación detallada suele limitarse a mejorar la precisión de los modelos de clasificación, ignorando la necesidad de aplicaciones ligeras y eficientes en aplicaciones prácticas, lo que resulta en una desconexión con la realidad. En este documento, se propone un método de reconocimiento detallado de coches basado en una red de atención ligera y ajuste fino regularizado. Basándose en la arquitectura de red neuronal convolucional (CNN) ligera y de alto rendimiento MobileNet V3, se diseña una arquitectura de CNN mejorada HAM-MobileNet que incluye un módulo de atención híbrido. Se adopta una estrategia de ajuste fino regularizado que incluye restricciones de correlación. Al ajustar finamente el HAM-MobileNet, se puede lograr una clasificación precisa de imágenes de coches. Los resultados experimentales en el conjunto de datos de coches de Stanford muestran que el método propuesto alcanza una tasa de precisión del 84.6%, que es el nivel más alto entre todas las arquitecturas de CNN ligeras y es comparable a las arquitecturas de CNN no ligeras. Los resultados de visualización muestran que el módulo de atención híbrido propuesto puede hacer que el modelo de red se enfoque más en los objetos objetivo con clases consistentes, suprima los fondos irrelevantes para la tarea y otros ruidos, y mejore la capacidad de aprendizaje y generalización del modelo de red.