Identificación de personas por el sonido de los pasos utilizando redes neuronales convolucionales
Autores: Algermissen, Stephan; Hörnlein, Max
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Identificación de personas por el sonido de los pasos utilizando redes neuronales convolucionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Mecánica
Palabras clave
Firma acústica
Sonidos de pasos
Red neuronal convolucional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
La marcha humana es muy individual y puede servir como biométrico para identificar personas en grabaciones de cámaras. Se pueden lograr resultados comparables utilizando la firma acústica de los sonidos de los pasos humanos. Esta solución acústica ofrece la oportunidad de menos espacio de instalación y el uso de micrófonos rentables en comparación con el sistema visual. En este documento, se propone un método para la identificación de personas basado en los sonidos de los pasos. Primero, los sonidos de los pasos se aíslan de las grabaciones de micrófono y se separan en muestras de 500 ms. Las muestras se transforman con una ventana deslizante en coeficientes cepstrales en frecuencia mel (MFCC). El resultado se representa como una imagen que sirve como entrada para una red neuronal convolucional (CNN). El conjunto de datos para entrenar y validar la CNN se graba con cinco sujetos en el laboratorio acústico de DLR. Estos experimentos identifican un total de 1125 pasos. La validación de la CNN revela un puntaje mínimo de 0.94 para las cinco clases y una precisión de 0.98. Se aplica el método Grad-CAM para visualizar el trasfondo de su decisión con el fin de verificar la funcionalidad de la CNN propuesta. Posteriormente, se discuten dos desafíos para implementaciones prácticas, el ruido y el calzado diferente, utilizando datos experimentales.
Descripción
La marcha humana es muy individual y puede servir como biométrico para identificar personas en grabaciones de cámaras. Se pueden lograr resultados comparables utilizando la firma acústica de los sonidos de los pasos humanos. Esta solución acústica ofrece la oportunidad de menos espacio de instalación y el uso de micrófonos rentables en comparación con el sistema visual. En este documento, se propone un método para la identificación de personas basado en los sonidos de los pasos. Primero, los sonidos de los pasos se aíslan de las grabaciones de micrófono y se separan en muestras de 500 ms. Las muestras se transforman con una ventana deslizante en coeficientes cepstrales en frecuencia mel (MFCC). El resultado se representa como una imagen que sirve como entrada para una red neuronal convolucional (CNN). El conjunto de datos para entrenar y validar la CNN se graba con cinco sujetos en el laboratorio acústico de DLR. Estos experimentos identifican un total de 1125 pasos. La validación de la CNN revela un puntaje mínimo de 0.94 para las cinco clases y una precisión de 0.98. Se aplica el método Grad-CAM para visualizar el trasfondo de su decisión con el fin de verificar la funcionalidad de la CNN propuesta. Posteriormente, se discuten dos desafíos para implementaciones prácticas, el ruido y el calzado diferente, utilizando datos experimentales.