Marco Híbrido LDA-CNN para el Reconocimiento Robusto de Gestos de Mano Mioeléctricos de Fin a Fin Bajo Condiciones Dinámicas
Autores: Le, Hongquan; Panhuis, Marc in het; Spinks, Geoffrey M.; Alici, Gursel
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Marco Híbrido LDA-CNN para el Reconocimiento Robusto de Gestos de Mano Mioeléctricos de Fin a Fin Bajo Condiciones Dinámicas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Reconocimiento de gestos
Aprendizaje automático
Sistemas de manos prostéticas
Extracción de características
Modelos de aprendizaje profundo
Basado en sEMG
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El reconocimiento de gestos basado en el aprendizaje automático convencional es el principal enfoque de control para sistemas avanzados de manos prostéticas. Su limitación principal es la necesidad de extracción de características, que debe cumplir con los requisitos de control en tiempo real. Por otro lado, los modelos de aprendizaje profundo podrían sobreajustarse cuando se entrenan con conjuntos de datos pequeños. Por estas razones, proponemos un marco híbrido de Análisis Discriminante Lineal-red neuronal convolucional (LDA-CNN) para mejorar el rendimiento del reconocimiento de gestos en sistemas de control de manos prostéticas basados en sEMG. Dentro de este marco, se entrenan filtros 1D-CNN para generar una representación latente que se aproxima estrechamente al subespacio discriminante de Fisher (LDA), construido a partir de características elaboradas a mano. Bajo el esquema de evaluación de entrenar uno y probar todos, nuestro marco híbrido propuesto superó consistentemente al 1D-CNN entrenado solo con pérdida de entropía cruzada, mostrando mejoras del 4% al 11% en dos conjuntos de datos públicos que presentan gestos de mano grabados en diversas posiciones de extremidades y niveles de contracción muscular del brazo. Además, nuestro marco mostró ventajas en términos de regularización espectral inducida, lo que llevó a un error de reconocimiento de vanguardia del 22.79% con el conjunto de 23 características ampliado cuando se probó en el conjunto de datos de múltiples posiciones de extremidades. La principal novedad de nuestro marco híbrido es que desacopla la extracción de características en relación con el tiempo de inferencia, lo que permite la futura incorporación de un conjunto más amplio de características, mientras mantiene el tiempo de cálculo de inferencia al mínimo.
Descripción
El reconocimiento de gestos basado en el aprendizaje automático convencional es el principal enfoque de control para sistemas avanzados de manos prostéticas. Su limitación principal es la necesidad de extracción de características, que debe cumplir con los requisitos de control en tiempo real. Por otro lado, los modelos de aprendizaje profundo podrían sobreajustarse cuando se entrenan con conjuntos de datos pequeños. Por estas razones, proponemos un marco híbrido de Análisis Discriminante Lineal-red neuronal convolucional (LDA-CNN) para mejorar el rendimiento del reconocimiento de gestos en sistemas de control de manos prostéticas basados en sEMG. Dentro de este marco, se entrenan filtros 1D-CNN para generar una representación latente que se aproxima estrechamente al subespacio discriminante de Fisher (LDA), construido a partir de características elaboradas a mano. Bajo el esquema de evaluación de entrenar uno y probar todos, nuestro marco híbrido propuesto superó consistentemente al 1D-CNN entrenado solo con pérdida de entropía cruzada, mostrando mejoras del 4% al 11% en dos conjuntos de datos públicos que presentan gestos de mano grabados en diversas posiciones de extremidades y niveles de contracción muscular del brazo. Además, nuestro marco mostró ventajas en términos de regularización espectral inducida, lo que llevó a un error de reconocimiento de vanguardia del 22.79% con el conjunto de 23 características ampliado cuando se probó en el conjunto de datos de múltiples posiciones de extremidades. La principal novedad de nuestro marco híbrido es que desacopla la extracción de características en relación con el tiempo de inferencia, lo que permite la futura incorporación de un conjunto más amplio de características, mientras mantiene el tiempo de cálculo de inferencia al mínimo.