CNN 1D: Un modelo robusto para la estimación de la pose humana
Autores: Cruz, Mercedes Hernández de la; Solache, Uriel; Luna-Álvarez, Antonio; Zagal-Barrera, Sergio Ricardo; Morales López, Daniela Aurora; Mujica-Vargas, Dante
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
CNN 1D: Un modelo robusto para la estimación de la pose humana
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelo eficiente
Estimación de pose humana
Modelo CNN1D
Conjunto de datos de posturas de yoga
Métricas de precisión
Entornos en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El propósito de esta investigación es desarrollar un modelo eficiente para la estimación de la pose humana (HPE). Las principales limitaciones del estudio incluyen el pequeño tamaño del conjunto de datos y las confusiones en la clasificación de ciertas poses, lo que sugiere la necesidad de más datos para mejorar la robustez del modelo en entornos no controlados. La metodología utilizada combina MediaPipe para la detección de puntos clave en imágenes con un modelo CNN1D que procesa secuencias de características preprocesadas. Se utilizó el conjunto de datos de Poses de Yoga para el entrenamiento y la validación del modelo, y se aplicaron técnicas de remuestreo, como el bootstrapping, para mejorar la precisión y evitar el sobreajuste en el entrenamiento. Los resultados muestran que el modelo propuesto alcanza un 96% de precisión general en la clasificación de cinco poses de yoga, con métricas de precisión superiores al 90% para todas las clases. La implementación del modelo CNN1D en lugar de arquitecturas tradicionales 2D o 3D logra el objetivo de mantener un bajo costo computacional y un preprocesamiento eficiente de las imágenes, permitiendo su uso en dispositivos móviles y entornos en tiempo real.
Descripción
El propósito de esta investigación es desarrollar un modelo eficiente para la estimación de la pose humana (HPE). Las principales limitaciones del estudio incluyen el pequeño tamaño del conjunto de datos y las confusiones en la clasificación de ciertas poses, lo que sugiere la necesidad de más datos para mejorar la robustez del modelo en entornos no controlados. La metodología utilizada combina MediaPipe para la detección de puntos clave en imágenes con un modelo CNN1D que procesa secuencias de características preprocesadas. Se utilizó el conjunto de datos de Poses de Yoga para el entrenamiento y la validación del modelo, y se aplicaron técnicas de remuestreo, como el bootstrapping, para mejorar la precisión y evitar el sobreajuste en el entrenamiento. Los resultados muestran que el modelo propuesto alcanza un 96% de precisión general en la clasificación de cinco poses de yoga, con métricas de precisión superiores al 90% para todas las clases. La implementación del modelo CNN1D en lugar de arquitecturas tradicionales 2D o 3D logra el objetivo de mantener un bajo costo computacional y un preprocesamiento eficiente de las imágenes, permitiendo su uso en dispositivos móviles y entornos en tiempo real.