logo móvil
Contáctanos

Lcam: módulo de atención de baja complejidad para redes de reconocimiento facial livianas

Autores: Hoo, Seng Chun; Ibrahim, Haidi; Suandi, Shahrel Azmin; Ng, Theam Foo

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Lcam: módulo de atención de baja complejidad para redes de reconocimiento facial livianas


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Módulos de atención
Características del canal
Características espaciales
Operaciones de punto flotante
Recuentos de parámetros
Reconocimiento facial

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Inspirado por el sistema visual humano para concentrarse en la región importante de una escena, los módulos de atención recalibran los pesos de las características de canal solas o junto con características espaciales para priorizar regiones informativas mientras suprimen información no importante. Sin embargo, las operaciones de punto flotante (FLOPs) y el recuento de parámetros son considerablemente altos cuando se incorporan estos módulos, especialmente para aquellos con atenciones de canal y espaciales en un modelo base. A pesar del éxito de los módulos de atención en tareas generales de clasificación de ImageNet, se debe dar énfasis a la incorporación de estos módulos en tareas de reconocimiento facial. Por lo tanto, se propone un mecanismo de atención novedoso con tres ramas paralelas conocido como el Módulo de Atención de Baja Complejidad (LCAM). Cabe destacar que solo hay una operación de convolución para cada rama. Por lo tanto, el LCAM es ligero, pero aún puede lograr un mejor rendimiento. Experimentos de tareas de verificación facial indican que LCAM logra resultados similares o incluso mejores en comparación con los de módulos anteriores que incorporan atenciones de canal y espaciales. Además, en comparación con el modelo base sin módulos de atención, LCAM logra valores de rendimiento del 0,84% en ConvFaceNeXt, 1,15% en MobileFaceNet y 0,86% en ProxylessFaceNAS con respecto a la precisión promedio de siete conjuntos de datos de reconocimiento facial basados en imágenes.

Otros recursos que podrían interesarte

Temas Virtualpro