Detección de distracción del conductor basada en mejora de fusión y optimización de saliencia global
Autores: Huang, Xueda; Gu, Shuangshuang; Li, Yuanyuan; Qi, Guanqiu; Zhu, Zhiqin; An, Yiyao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de distracción del conductor basada en mejora de fusión y optimización de saliencia global
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Detección de distracción del conductor
Algoritmos de aprendizaje profundo
Modelos livianos
Aligeramiento de red
Optimización de saliencia global
Capacidades de fusión de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La detección de distracciones del conductor no solo previene eficazmente los accidentes de tráfico, sino que también promueve el desarrollo de sistemas de transporte inteligentes. En los últimos años, gracias a las potentes capacidades de aprendizaje de características de los algoritmos de aprendizaje profundo, los métodos de detección de distracciones del conductor basados en aprendizaje profundo han aumentado significativamente. Sin embargo, para dispositivos embarcados con recursos limitados, los modelos ligeros en tiempo real son cruciales. La mayoría de los métodos existentes tienden a centrarse únicamente en el diseño de modelos ligeros, descuidando la pérdida en el rendimiento de detección para objetivos pequeños. Para lograr un equilibrio entre la precisión de detección y la ligereza de la red, este documento propone un método de detección de distracciones del conductor que combina la mejora y la optimización de la saliencia global. El método consta principalmente de tres módulos: módulo de mejora de fusión de contexto (CFEM), módulo de retroalimentación de optimización de canal (COFM) y módulo de destilación de saliencia de canal (CSDM). En el módulo CFEM, se utiliza convolución unidimensional para capturar información entre píxeles distantes, y se adopta un mecanismo de inyección para integrar aún más información semántica de alto nivel con información detallada de bajo nivel, mejorando las capacidades de fusión de características. El módulo COFM incorpora un mecanismo de retroalimentación para considerar el impacto de las relaciones de canal entre capas e intra-capas en el rendimiento de compresión del modelo, logrando la poda conjunta de canales globales. El módulo CSDM guía a la red estudiante para aprender la información de características sobresalientes de la red maestra, equilibrando efectivamente el rendimiento y la precisión en tiempo real del modelo. Los resultados experimentales muestran que este método supera a los métodos de vanguardia en tareas de detección de distracciones del conductor, demostrando un buen rendimiento y perspectivas de aplicación potenciales.
Descripción
La detección de distracciones del conductor no solo previene eficazmente los accidentes de tráfico, sino que también promueve el desarrollo de sistemas de transporte inteligentes. En los últimos años, gracias a las potentes capacidades de aprendizaje de características de los algoritmos de aprendizaje profundo, los métodos de detección de distracciones del conductor basados en aprendizaje profundo han aumentado significativamente. Sin embargo, para dispositivos embarcados con recursos limitados, los modelos ligeros en tiempo real son cruciales. La mayoría de los métodos existentes tienden a centrarse únicamente en el diseño de modelos ligeros, descuidando la pérdida en el rendimiento de detección para objetivos pequeños. Para lograr un equilibrio entre la precisión de detección y la ligereza de la red, este documento propone un método de detección de distracciones del conductor que combina la mejora y la optimización de la saliencia global. El método consta principalmente de tres módulos: módulo de mejora de fusión de contexto (CFEM), módulo de retroalimentación de optimización de canal (COFM) y módulo de destilación de saliencia de canal (CSDM). En el módulo CFEM, se utiliza convolución unidimensional para capturar información entre píxeles distantes, y se adopta un mecanismo de inyección para integrar aún más información semántica de alto nivel con información detallada de bajo nivel, mejorando las capacidades de fusión de características. El módulo COFM incorpora un mecanismo de retroalimentación para considerar el impacto de las relaciones de canal entre capas e intra-capas en el rendimiento de compresión del modelo, logrando la poda conjunta de canales globales. El módulo CSDM guía a la red estudiante para aprender la información de características sobresalientes de la red maestra, equilibrando efectivamente el rendimiento y la precisión en tiempo real del modelo. Los resultados experimentales muestran que este método supera a los métodos de vanguardia en tareas de detección de distracciones del conductor, demostrando un buen rendimiento y perspectivas de aplicación potenciales.