Cagnet: un método de atención convolucional a varias escalas para la detección de vidrio basado en Transformer
Autores: Hu, Xiaohang; Gao, Rui; Yang, Seungjun; Cho, Kyungeun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Cagnet: un método de atención convolucional a varias escalas para la detección de vidrio basado en Transformer
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Vidrio
Detección
CAGNet
Atención convolucional
Segmentación
Transformador
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El vidrio juega un papel vital en varios campos, lo que hace que su detección precisa sea crucial. La detección adecuada previene juicios erróneos, reduce el ruido de los reflejos y asegura un rendimiento óptimo en otras tareas de visión por computadora. Sin embargo, el uso prevalente del vidrio en aplicaciones diarias plantea desafíos únicos para la visión por computadora. Este estudio presenta una nueva red de segmentación de vidrio con atención convolucional (CAGNet) basada en una arquitectura de transformador personalizada para la detección de vidrio en imágenes. Basado en los cimientos de nuestro estudio previo, CAGNet minimiza el número de ciclos de entrenamiento e iteraciones, lo que resulta en un rendimiento y eficiencia mejorados. CAGNet se basa en el diseño estratégico y la integración de dos tipos de mecanismos de atención convolucional junto con una cabeza de transformador aplicada para un análisis y fusión de características completos. Para aumentar aún más la precisión de la segmentación, la red incorpora un esquema de ponderación de bordes personalizado para optimizar la detección de vidrio en imágenes. Estudios comparativos y pruebas rigurosas demuestran que CAGNet supera a varias metodologías líderes en la detección de vidrio, mostrando robustez en una amplia gama de condiciones. Específicamente, la métrica de IOU mejora en un 0.26% en comparación con la de nuestro estudio anterior y presenta una mejora del 0.92% sobre las de otros métodos de vanguardia.
Descripción
El vidrio juega un papel vital en varios campos, lo que hace que su detección precisa sea crucial. La detección adecuada previene juicios erróneos, reduce el ruido de los reflejos y asegura un rendimiento óptimo en otras tareas de visión por computadora. Sin embargo, el uso prevalente del vidrio en aplicaciones diarias plantea desafíos únicos para la visión por computadora. Este estudio presenta una nueva red de segmentación de vidrio con atención convolucional (CAGNet) basada en una arquitectura de transformador personalizada para la detección de vidrio en imágenes. Basado en los cimientos de nuestro estudio previo, CAGNet minimiza el número de ciclos de entrenamiento e iteraciones, lo que resulta en un rendimiento y eficiencia mejorados. CAGNet se basa en el diseño estratégico y la integración de dos tipos de mecanismos de atención convolucional junto con una cabeza de transformador aplicada para un análisis y fusión de características completos. Para aumentar aún más la precisión de la segmentación, la red incorpora un esquema de ponderación de bordes personalizado para optimizar la detección de vidrio en imágenes. Estudios comparativos y pruebas rigurosas demuestran que CAGNet supera a varias metodologías líderes en la detección de vidrio, mostrando robustez en una amplia gama de condiciones. Específicamente, la métrica de IOU mejora en un 0.26% en comparación con la de nuestro estudio anterior y presenta una mejora del 0.92% sobre las de otros métodos de vanguardia.