Mejora de YOLOX con Cabeza de Atención Unida para la Detección de Carreteras al Conducir
Autores: Wu, Yuhuan; Wu, Yonghong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejora de YOLOX con Cabeza de Atención Unida para la Detección de Carreteras al Conducir
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Detección de objetos
Conducción autónoma
YOLOX
Cabeza de Atención Unida
GhostNet
Autoatención Espacial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La detección de objetos juega un papel crucial en los sistemas de asistencia para la conducción autónoma. Requiere alta precisión para la predicción, un tamaño pequeño para su despliegue en dispositivos móviles y velocidad de inferencia en tiempo real para garantizar la seguridad. En este documento, presentamos un algoritmo compacto y eficiente llamado YOLOX con Cabeza de Atención Unida (UAH-YOLOX) para la detección en escenarios de conducción autónoma. Al reemplazar la red principal con GhostNet para la extracción de características, el modelo reduce el número de parámetros y la complejidad computacional. Al agregar una cabeza de atención unida antes de la cabeza YOLO, el modelo detecta efectivamente las características de escala, posición y contorno de los objetivos. En particular, se diseñó un módulo de atención llamado Autoatención Espacial para extraer información de ubicación espacial, demostrando un gran potencial en la detección. En nuestra red, la Pérdida de IOU (Intersección de Unión) se ha reemplazado por la Pérdida de CIOU (Intersección Completa de Unión). Experimentos adicionales demuestran la efectividad de nuestros métodos propuestos en el conjunto de datos BDD100k y el conjunto de datos de Peatones de Caltech. UAH-YOLOX logra resultados de vanguardia al mejorar la precisión de detección del conjunto de datos BDD100k en un 1.70% y aumentar la velocidad de procesamiento en 3.37 fotogramas por segundo (FPS). La visualización proporciona ejemplos específicos en varios escenarios.
Descripción
La detección de objetos juega un papel crucial en los sistemas de asistencia para la conducción autónoma. Requiere alta precisión para la predicción, un tamaño pequeño para su despliegue en dispositivos móviles y velocidad de inferencia en tiempo real para garantizar la seguridad. En este documento, presentamos un algoritmo compacto y eficiente llamado YOLOX con Cabeza de Atención Unida (UAH-YOLOX) para la detección en escenarios de conducción autónoma. Al reemplazar la red principal con GhostNet para la extracción de características, el modelo reduce el número de parámetros y la complejidad computacional. Al agregar una cabeza de atención unida antes de la cabeza YOLO, el modelo detecta efectivamente las características de escala, posición y contorno de los objetivos. En particular, se diseñó un módulo de atención llamado Autoatención Espacial para extraer información de ubicación espacial, demostrando un gran potencial en la detección. En nuestra red, la Pérdida de IOU (Intersección de Unión) se ha reemplazado por la Pérdida de CIOU (Intersección Completa de Unión). Experimentos adicionales demuestran la efectividad de nuestros métodos propuestos en el conjunto de datos BDD100k y el conjunto de datos de Peatones de Caltech. UAH-YOLOX logra resultados de vanguardia al mejorar la precisión de detección del conjunto de datos BDD100k en un 1.70% y aumentar la velocidad de procesamiento en 3.37 fotogramas por segundo (FPS). La visualización proporciona ejemplos específicos en varios escenarios.