Hybrid-DC: un marco híbrido que utiliza ResNet-50 y Vision Transformer para la clasificación de defectos en la superficie de acero en el proceso de laminado
Autores: Jeong, Minjun; Yang, Minyeol; Jeong, Jongpil
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Hybrid-DC: un marco híbrido que utiliza ResNet-50 y Vision Transformer para la clasificación de defectos en la superficie de acero en el proceso de laminado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Hybrid-dc
Resnet-50
Vision transformer
Clasificación de defectos en superficies de acero
Aprendizaje de contexto global
Mecanismo de fusión de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Este estudio presenta Hybrid-DC, un modelo híbrido de aprendizaje profundo que integra ResNet-50 y Vision Transformer (ViT) para la clasificación de defectos en la superficie de acero con alta precisión. Hybrid-DC aprovecha ResNet-50 para una extracción eficiente de características tanto en niveles bajos como altos y utiliza el aprendizaje de contexto global de ViT para mejorar la precisión de la clasificación. Una capa de atención híbrida única y un mecanismo de fusión de atención permiten que Hybrid-DC se adapte a los patrones complejos y variables típicos de los defectos en la superficie de acero. Las evaluaciones experimentales demuestran que Hybrid-DC logra mejoras sustanciales en la precisión y una reducción significativa de la pérdida en comparación con modelos tradicionales como MobileNetV2 y ResNet, con una precisión de validación que alcanza 0.9944. Los resultados sugieren que este modelo, caracterizado por una convergencia rápida y un aprendizaje estable, puede aplicarse para el control de calidad en tiempo real en la fabricación de acero y otras industrias de alta precisión, mejorando la eficiencia en la detección automatizada de defectos.
Descripción
Este estudio presenta Hybrid-DC, un modelo híbrido de aprendizaje profundo que integra ResNet-50 y Vision Transformer (ViT) para la clasificación de defectos en la superficie de acero con alta precisión. Hybrid-DC aprovecha ResNet-50 para una extracción eficiente de características tanto en niveles bajos como altos y utiliza el aprendizaje de contexto global de ViT para mejorar la precisión de la clasificación. Una capa de atención híbrida única y un mecanismo de fusión de atención permiten que Hybrid-DC se adapte a los patrones complejos y variables típicos de los defectos en la superficie de acero. Las evaluaciones experimentales demuestran que Hybrid-DC logra mejoras sustanciales en la precisión y una reducción significativa de la pérdida en comparación con modelos tradicionales como MobileNetV2 y ResNet, con una precisión de validación que alcanza 0.9944. Los resultados sugieren que este modelo, caracterizado por una convergencia rápida y un aprendizaje estable, puede aplicarse para el control de calidad en tiempo real en la fabricación de acero y otras industrias de alta precisión, mejorando la eficiencia en la detección automatizada de defectos.