Clasificación de superficies a partir de datos de series temporales de la Unidad de Medida Interna del Robot utilizando modelos de fusión de aprendizaje profundo en cascada y paralelo
Autores: Al-refai, Ghaith; Karasneh, Dina; Elmoaqet, Hisham; Ryalat, Mutaz; Almtireen, Natheer
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Clasificación de superficies a partir de datos de series temporales de la Unidad de Medida Interna del Robot utilizando modelos de fusión de aprendizaje profundo en cascada y paralelo
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Clasificación de superficies
Modelos de aprendizaje profundo
Sensor IMU
Modelos de fusión
CNN
LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
La clasificación de superficies es crítica para los robots terrestres que operan en entornos diversos, ya que mejora la movilidad, la estabilidad y la adaptabilidad. Este estudio presenta modelos de aprendizaje profundo basados en IMU para la clasificación de superficies como una alternativa de bajo costo a los sistemas de visión por computadora. Se introdujeron dos modelos de fusión de características para clasificar el tipo de superficie utilizando datos de series temporales de un sensor IMU montado en un robot terrestre. El primer modelo, un modelo de fusión en cascada, emplea una Red Neuronal Convolucional (CNN) 1-D seguida de una red de Memoria a Largo y Corto Plazo (LSTM) y luego un mecanismo de atención multi-cabeza. El segundo modelo es un modelo de fusión paralelo, que procesa los datos del sensor a través de una CNN y una LSTM simultáneamente antes de concatenar los vectores de características resultantes y luego pasarlos a un mecanismo de atención multi-cabeza. Ambos modelos utilizan un mecanismo de atención multi-cabeza para mejorar el enfoque en segmentos relevantes de los datos de la secuencia temporal. Los modelos fueron entrenados en un conjunto de datos normalizado de Unidad de Medida Interna (IMU), con ajuste de hiperparámetros logrado a través de búsqueda en cuadrícula para un rendimiento óptimo. Los resultados mostraron que el modelo en cascada logró métricas de precisión más altas, incluyendo una Precisión Media Promedio (mAP) de 0.721 en comparación con 0.693 para el modelo paralelo. Sin embargo, el modelo en cascada incurrió en un aumento del 44.37% en el tiempo de procesamiento, lo que hace que el modelo de fusión paralelo sea más adecuado para aplicaciones en tiempo real. El mecanismo de atención multi-cabeza contribuyó significativamente a las mejoras en la precisión, particularmente en el modelo en cascada.
Descripción
La clasificación de superficies es crítica para los robots terrestres que operan en entornos diversos, ya que mejora la movilidad, la estabilidad y la adaptabilidad. Este estudio presenta modelos de aprendizaje profundo basados en IMU para la clasificación de superficies como una alternativa de bajo costo a los sistemas de visión por computadora. Se introdujeron dos modelos de fusión de características para clasificar el tipo de superficie utilizando datos de series temporales de un sensor IMU montado en un robot terrestre. El primer modelo, un modelo de fusión en cascada, emplea una Red Neuronal Convolucional (CNN) 1-D seguida de una red de Memoria a Largo y Corto Plazo (LSTM) y luego un mecanismo de atención multi-cabeza. El segundo modelo es un modelo de fusión paralelo, que procesa los datos del sensor a través de una CNN y una LSTM simultáneamente antes de concatenar los vectores de características resultantes y luego pasarlos a un mecanismo de atención multi-cabeza. Ambos modelos utilizan un mecanismo de atención multi-cabeza para mejorar el enfoque en segmentos relevantes de los datos de la secuencia temporal. Los modelos fueron entrenados en un conjunto de datos normalizado de Unidad de Medida Interna (IMU), con ajuste de hiperparámetros logrado a través de búsqueda en cuadrícula para un rendimiento óptimo. Los resultados mostraron que el modelo en cascada logró métricas de precisión más altas, incluyendo una Precisión Media Promedio (mAP) de 0.721 en comparación con 0.693 para el modelo paralelo. Sin embargo, el modelo en cascada incurrió en un aumento del 44.37% en el tiempo de procesamiento, lo que hace que el modelo de fusión paralelo sea más adecuado para aplicaciones en tiempo real. El mecanismo de atención multi-cabeza contribuyó significativamente a las mejoras en la precisión, particularmente en el modelo en cascada.