logo móvil
Contáctanos

MfaNet: una red de clasificación de cuellos basada en características de múltiples escalas y un mecanismo de atención

Autores: Qin, Xiao; Ya, Shanshan; Yuan, Changan; Chen, Dingjia; Long, Long; Liao, Huixian

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

MfaNet: una red de clasificación de cuellos basada en características de múltiples escalas y un mecanismo de atención


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Collar
Clasificación
Módulo convolucional
MFA
Vector de peso de atención
Reconocimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
El cuello es una parte importante de una prenda que refleja su estilo. La tarea de clasificación del cuello consiste en reconocer el tipo de cuello en la imagen de la prenda. En este documento, diseñamos un módulo de convolución novedoso llamado MFA (atención a características de múltiples escalas) para abordar los problemas de alto ruido, objetivo de reconocimiento pequeño y efecto de clasificación insatisfactorio en el reconocimiento de características del cuello, que extrae primero características de múltiples escalas del mapa de características de entrada y luego las codifica en un vector de peso de atención para mejorar la representación de partes importantes, mejorando así la capacidad del bloque convolucional para combatir el ruido y extraer características de objetos de destino pequeños. También reduce la carga computacional del módulo MFA utilizando el método de convolución de separación de profundidad. Los experimentos en el conjunto de datos del cuello Collar6 y en el conjunto de datos de prendas DeepFashion6 (un subconjunto de la base de datos DeepFashion) muestran que MFANet es capaz de funcionar con un número relativamente pequeño de cuellos. MFANet puede lograr un mejor rendimiento de clasificación que la mayoría de las redes neuronales convolucionales de corriente principal actuales para imágenes de cuellos complejos con menos carga computacional. Los experimentos en el conjunto de datos estándar CIFAR-10 muestran que MFANet también supera a los algoritmos de clasificación de imágenes de corriente principal actuales.

Otros recursos que podrían interesarte

Temas Virtualpro