Detección de la somnolencia del conductor utilizando características faciales híbridas y aprendizaje en conjunto
Autores: Xu, Changbiao; Huang, Wenhao; Liu, Jiao; Li, Lang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Detección de la somnolencia del conductor utilizando características faciales híbridas y aprendizaje en conjunto
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Somnolencia
Sistemas de detección
Basados en señales faciales
Extracción de características personalizadas
Modelo de conjunto
Regiones faciales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La somnolencia al conducir representa un riesgo significativo en términos de seguridad vial, lo que hace que los sistemas efectivos de detección de somnolencia sean esenciales para la prevención de accidentes. Los métodos de detección basados en señales faciales han demostrado ser un enfoque efectivo para la detección de somnolencia. Sin embargo, presentan desafíos derivados de las diferencias interindividuales entre los conductores. Las variaciones en la estructura facial requieren umbrales de extracción de características personalizados, sin embargo, los métodos existentes aplican un umbral uniforme, lo que lleva a una extracción de características inexacta. Además, muchos métodos actuales se centran solo en una o dos regiones faciales, pasando por alto la posibilidad de que la somnolencia pueda manifestarse de manera diferente en diferentes áreas faciales entre distintos conductores. Para abordar estos problemas, proponemos un método de detección de somnolencia que combina un modelo de conjunto con características faciales híbridas. Este enfoque permite la extracción precisa de características de cuatro regiones faciales clave: la región de los ojos, el contorno de la boca, la posición de la cabeza y la dirección de la mirada, a través de la corrección de umbrales adaptativos para asegurar una cobertura integral. Luego, se emplea un modelo de conjunto, combinando Random Forest, XGBoost y Perceptrón Multicapa con un criterio de votación suave, para clasificar el estado de somnolencia de los conductores. Además, utilizamos el método SHAP para garantizar la explicabilidad del modelo y analizar las correlaciones entre las características de varias regiones faciales. Entrenado y probado en el conjunto de datos UTA-RLDD, nuestro método logra una precisión de video (VA) del 86.52%, superando técnicas similares introducidas en los últimos años. El análisis de interpretabilidad demuestra el valor de nuestro enfoque, ofreciendo una referencia valiosa para futuras investigaciones y contribuyendo significativamente a la seguridad vial.
Descripción
La somnolencia al conducir representa un riesgo significativo en términos de seguridad vial, lo que hace que los sistemas efectivos de detección de somnolencia sean esenciales para la prevención de accidentes. Los métodos de detección basados en señales faciales han demostrado ser un enfoque efectivo para la detección de somnolencia. Sin embargo, presentan desafíos derivados de las diferencias interindividuales entre los conductores. Las variaciones en la estructura facial requieren umbrales de extracción de características personalizados, sin embargo, los métodos existentes aplican un umbral uniforme, lo que lleva a una extracción de características inexacta. Además, muchos métodos actuales se centran solo en una o dos regiones faciales, pasando por alto la posibilidad de que la somnolencia pueda manifestarse de manera diferente en diferentes áreas faciales entre distintos conductores. Para abordar estos problemas, proponemos un método de detección de somnolencia que combina un modelo de conjunto con características faciales híbridas. Este enfoque permite la extracción precisa de características de cuatro regiones faciales clave: la región de los ojos, el contorno de la boca, la posición de la cabeza y la dirección de la mirada, a través de la corrección de umbrales adaptativos para asegurar una cobertura integral. Luego, se emplea un modelo de conjunto, combinando Random Forest, XGBoost y Perceptrón Multicapa con un criterio de votación suave, para clasificar el estado de somnolencia de los conductores. Además, utilizamos el método SHAP para garantizar la explicabilidad del modelo y analizar las correlaciones entre las características de varias regiones faciales. Entrenado y probado en el conjunto de datos UTA-RLDD, nuestro método logra una precisión de video (VA) del 86.52%, superando técnicas similares introducidas en los últimos años. El análisis de interpretabilidad demuestra el valor de nuestro enfoque, ofreciendo una referencia valiosa para futuras investigaciones y contribuyendo significativamente a la seguridad vial.