Un enfoque mejorado para la detección de la intención de las luces traseras en tiempo real por vehículos inteligentes
Autores: Tong, Bingming; Chen, Wei; Li, Changzhen; Du, Luyao; Xiao, Zhihao; Zhang, Donghua
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un enfoque mejorado para la detección de la intención de las luces traseras en tiempo real por vehículos inteligentes
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Vehículo
Luz trasera
Detección de intenciones
Rendimiento en tiempo real
Enfoque ligero
Detección de objetos pequeños
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
La detección de la intención de las luces traseras de los vehículos es una aplicación importante para la percepción y la toma de decisiones por parte de vehículos inteligentes. Sin embargo, mejorar efectivamente la precisión de la detección con un rendimiento en tiempo real suficiente es un problema crítico en aplicaciones prácticas. En este estudio, se propone un enfoque ligero mejorado basado en visión, centrado en la detección de objetos pequeños con una estrategia de múltiples escalas, para lograr la detección de intención de luces traseras de vehículos orientada a la aplicación en tiempo real. El modelo de detección en tiempo real propuesto está diseñado sobre la base de YOLOv4-tiny, y se emplea un módulo de agrupamiento piramidal espacial rápido (SPPF) para enriquecer las características de la capa de salida. Se añade una escala de detección adicional para expandir el campo receptivo correspondiente a objetos pequeños. Mientras tanto, se utiliza una red de agregación de caminos (PANet) para mejorar la resolución de características de objetos pequeños mediante la construcción de una pirámide de características con conexiones entre capas de características. Se establece un conjunto de datos ampliado basado en el conjunto de datos BDD100K para verificar el rendimiento del método propuesto. Los resultados experimentales en el conjunto de datos ampliado revelan que el método propuesto puede aumentar la precisión media (AP) de las señales de vehículo, freno, giro a la izquierda y giro a la derecha en un 1.81, 15.16, 40.04 y 41.53%, respectivamente. La precisión media promedio (mAP) puede mejorarse en un 24.63% (de 62.20% a 86.83%) a más de 70 fotogramas por segundo (FPS), demostrando que el método propuesto puede mejorar efectivamente la precisión de detección con un buen rendimiento en tiempo real.
Descripción
La detección de la intención de las luces traseras de los vehículos es una aplicación importante para la percepción y la toma de decisiones por parte de vehículos inteligentes. Sin embargo, mejorar efectivamente la precisión de la detección con un rendimiento en tiempo real suficiente es un problema crítico en aplicaciones prácticas. En este estudio, se propone un enfoque ligero mejorado basado en visión, centrado en la detección de objetos pequeños con una estrategia de múltiples escalas, para lograr la detección de intención de luces traseras de vehículos orientada a la aplicación en tiempo real. El modelo de detección en tiempo real propuesto está diseñado sobre la base de YOLOv4-tiny, y se emplea un módulo de agrupamiento piramidal espacial rápido (SPPF) para enriquecer las características de la capa de salida. Se añade una escala de detección adicional para expandir el campo receptivo correspondiente a objetos pequeños. Mientras tanto, se utiliza una red de agregación de caminos (PANet) para mejorar la resolución de características de objetos pequeños mediante la construcción de una pirámide de características con conexiones entre capas de características. Se establece un conjunto de datos ampliado basado en el conjunto de datos BDD100K para verificar el rendimiento del método propuesto. Los resultados experimentales en el conjunto de datos ampliado revelan que el método propuesto puede aumentar la precisión media (AP) de las señales de vehículo, freno, giro a la izquierda y giro a la derecha en un 1.81, 15.16, 40.04 y 41.53%, respectivamente. La precisión media promedio (mAP) puede mejorarse en un 24.63% (de 62.20% a 86.83%) a más de 70 fotogramas por segundo (FPS), demostrando que el método propuesto puede mejorar efectivamente la precisión de detección con un buen rendimiento en tiempo real.