Lcam: módulo de atención de baja complejidad para redes de reconocimiento facial livianas
Autores: Hoo, Seng Chun; Ibrahim, Haidi; Suandi, Shahrel Azmin; Ng, Theam Foo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Lcam: módulo de atención de baja complejidad para redes de reconocimiento facial livianas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Módulos de atención
Características del canal
Características espaciales
Operaciones de punto flotante
Recuentos de parámetros
Reconocimiento facial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Inspirado por el sistema visual humano para concentrarse en la región importante de una escena, los módulos de atención recalibran los pesos de las características de canal solas o junto con características espaciales para priorizar regiones informativas mientras suprimen información no importante. Sin embargo, las operaciones de punto flotante (FLOPs) y el recuento de parámetros son considerablemente altos cuando se incorporan estos módulos, especialmente para aquellos con atenciones de canal y espaciales en un modelo base. A pesar del éxito de los módulos de atención en tareas generales de clasificación de ImageNet, se debe dar énfasis a la incorporación de estos módulos en tareas de reconocimiento facial. Por lo tanto, se propone un mecanismo de atención novedoso con tres ramas paralelas conocido como el Módulo de Atención de Baja Complejidad (LCAM). Cabe destacar que solo hay una operación de convolución para cada rama. Por lo tanto, el LCAM es ligero, pero aún puede lograr un mejor rendimiento. Experimentos de tareas de verificación facial indican que LCAM logra resultados similares o incluso mejores en comparación con los de módulos anteriores que incorporan atenciones de canal y espaciales. Además, en comparación con el modelo base sin módulos de atención, LCAM logra valores de rendimiento del 0,84% en ConvFaceNeXt, 1,15% en MobileFaceNet y 0,86% en ProxylessFaceNAS con respecto a la precisión promedio de siete conjuntos de datos de reconocimiento facial basados en imágenes.
Descripción
Inspirado por el sistema visual humano para concentrarse en la región importante de una escena, los módulos de atención recalibran los pesos de las características de canal solas o junto con características espaciales para priorizar regiones informativas mientras suprimen información no importante. Sin embargo, las operaciones de punto flotante (FLOPs) y el recuento de parámetros son considerablemente altos cuando se incorporan estos módulos, especialmente para aquellos con atenciones de canal y espaciales en un modelo base. A pesar del éxito de los módulos de atención en tareas generales de clasificación de ImageNet, se debe dar énfasis a la incorporación de estos módulos en tareas de reconocimiento facial. Por lo tanto, se propone un mecanismo de atención novedoso con tres ramas paralelas conocido como el Módulo de Atención de Baja Complejidad (LCAM). Cabe destacar que solo hay una operación de convolución para cada rama. Por lo tanto, el LCAM es ligero, pero aún puede lograr un mejor rendimiento. Experimentos de tareas de verificación facial indican que LCAM logra resultados similares o incluso mejores en comparación con los de módulos anteriores que incorporan atenciones de canal y espaciales. Además, en comparación con el modelo base sin módulos de atención, LCAM logra valores de rendimiento del 0,84% en ConvFaceNeXt, 1,15% en MobileFaceNet y 0,86% en ProxylessFaceNAS con respecto a la precisión promedio de siete conjuntos de datos de reconocimiento facial basados en imágenes.