Reconocimiento de múltiples gestos de mano basado en radar de ondas milimétricas utilizando red neuronal de memoria a largo plazo (LSTM)
Autores: Grobelny, Piotr; Narbudowicz, Adam
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Reconocimiento de múltiples gestos de mano basado en radar de ondas milimétricas utilizando red neuronal de memoria a largo plazo (LSTM)
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje automático
Clasificación de gestos manuales
Señal de radar
LSTM
RNN
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
El documento propone una solución simple de aprendizaje automático para la clasificación de gestos de mano, basada en la señal de radar de ondas milimétricas procesada. Investiga la clasificación de hasta 12 gestos intuitivos y ergonómicos diferentes, que están destinados a servir como una interfaz de usuario sin contacto. El sistema se basa en el radar AWR1642 de modulación de frecuencia continua (FMCW), que permite capturar datos estandarizados para respaldar la escalabilidad de la solución propuesta. Se recopilaron más de 4000 muestras de 4 personas diferentes, con todas las firmas extraídas del hardware de radar disponible en una base de datos de acceso abierto que acompaña la publicación. Los datos recopilados fueron procesados y utilizados para entrenar una red neuronal recurrente a largo plazo (LSTM) y una arquitectura de red neuronal recurrente artificial (RNN). El trabajo estudia el impacto de diferentes parámetros de entrada, el número de capas ocultas y el número de neuronas en esas capas. La red LSTM propuesta permite la clasificación de diferentes gestos, con una precisión total que varía del 94,4% al 100% dependiendo del escenario de uso, con una arquitectura relativamente pequeña de solo 2 capas ocultas con 32 neuronas en cada una. La solución también se probó con datos adicionales grabados de sujetos que no participaron en el conjunto de entrenamiento original, lo que resultó en una disminución de precisión de no más del 2,24%. Esto demuestra que la solución propuesta es robusta y escalable, lo que permite la creación rápida y confiable de bases de datos más grandes de gestos para expandir el uso del aprendizaje automático con tecnologías de radar.
Descripción
El documento propone una solución simple de aprendizaje automático para la clasificación de gestos de mano, basada en la señal de radar de ondas milimétricas procesada. Investiga la clasificación de hasta 12 gestos intuitivos y ergonómicos diferentes, que están destinados a servir como una interfaz de usuario sin contacto. El sistema se basa en el radar AWR1642 de modulación de frecuencia continua (FMCW), que permite capturar datos estandarizados para respaldar la escalabilidad de la solución propuesta. Se recopilaron más de 4000 muestras de 4 personas diferentes, con todas las firmas extraídas del hardware de radar disponible en una base de datos de acceso abierto que acompaña la publicación. Los datos recopilados fueron procesados y utilizados para entrenar una red neuronal recurrente a largo plazo (LSTM) y una arquitectura de red neuronal recurrente artificial (RNN). El trabajo estudia el impacto de diferentes parámetros de entrada, el número de capas ocultas y el número de neuronas en esas capas. La red LSTM propuesta permite la clasificación de diferentes gestos, con una precisión total que varía del 94,4% al 100% dependiendo del escenario de uso, con una arquitectura relativamente pequeña de solo 2 capas ocultas con 32 neuronas en cada una. La solución también se probó con datos adicionales grabados de sujetos que no participaron en el conjunto de entrenamiento original, lo que resultó en una disminución de precisión de no más del 2,24%. Esto demuestra que la solución propuesta es robusta y escalable, lo que permite la creación rápida y confiable de bases de datos más grandes de gestos para expandir el uso del aprendizaje automático con tecnologías de radar.