Una Red de Detección de Carriles Eficiente con Atención de Coordenadas Mejorada por Canal
Autores: Xu, Ke; Hao, Zhicheng; Zhu, Ming; Wang, Jiarong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Una Red de Detección de Carriles Eficiente con Atención de Coordenadas Mejorada por Canal
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Detección de carriles
Segmentación semántica
Redes neuronales convolucionales
CNNs espaciales
Mecanismo de atención
Costo computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
La detección de carriles basada en segmentación semántica puede lograr una alta precisión, pero, en los últimos años, no tiene un costo amigable para dispositivos móviles, lo que se debe a la compleja iteración y a las costosas convoluciones en redes neuronales convolucionales (CNN) y modelos de última generación (SOTA) basados en CNN, como las CNN espaciales (SCNN). Aunque la SCNN ha demostrado su capacidad para capturar las relaciones espaciales de los píxeles a través de filas y columnas de una imagen, el costo computacional y el requerimiento de memoria necesarios no se pueden permitir en la detección de carriles móvil. Inspirados en la atención de canal y la máquina de autoatención, proponemos un módulo de atención de coordenadas integrada (ICA) para capturar las relaciones espaciales de los píxeles. Además, debido a la falta de mejora en la dimensión del canal, creamos una red eficiente con un bloque de atención de coordenadas mejorado por canal llamado CCA, compuesto por ICA y otros módulos de atención de canal, para la mejora de características en todas las dimensiones. Como resultado, al reemplazar muchas convoluciones repetidas o iterativas con el mecanismo de atención, CCA reduce la complejidad computacional. Así, nuestro método logra un equilibrio entre precisión y velocidad y tiene un mejor rendimiento en dos conjuntos de datos de carriles: TuSimple e ILane. Con un costo computacional inferior a unas pocas décimas, nuestro CCA logra una precisión superior en comparación con la SCNN. Estos resultados muestran que el bajo costo y el gran rendimiento de nuestro diseño permiten el uso de la tarea de detección de carriles en escenarios de piloto automático.
Descripción
La detección de carriles basada en segmentación semántica puede lograr una alta precisión, pero, en los últimos años, no tiene un costo amigable para dispositivos móviles, lo que se debe a la compleja iteración y a las costosas convoluciones en redes neuronales convolucionales (CNN) y modelos de última generación (SOTA) basados en CNN, como las CNN espaciales (SCNN). Aunque la SCNN ha demostrado su capacidad para capturar las relaciones espaciales de los píxeles a través de filas y columnas de una imagen, el costo computacional y el requerimiento de memoria necesarios no se pueden permitir en la detección de carriles móvil. Inspirados en la atención de canal y la máquina de autoatención, proponemos un módulo de atención de coordenadas integrada (ICA) para capturar las relaciones espaciales de los píxeles. Además, debido a la falta de mejora en la dimensión del canal, creamos una red eficiente con un bloque de atención de coordenadas mejorado por canal llamado CCA, compuesto por ICA y otros módulos de atención de canal, para la mejora de características en todas las dimensiones. Como resultado, al reemplazar muchas convoluciones repetidas o iterativas con el mecanismo de atención, CCA reduce la complejidad computacional. Así, nuestro método logra un equilibrio entre precisión y velocidad y tiene un mejor rendimiento en dos conjuntos de datos de carriles: TuSimple e ILane. Con un costo computacional inferior a unas pocas décimas, nuestro CCA logra una precisión superior en comparación con la SCNN. Estos resultados muestran que el bajo costo y el gran rendimiento de nuestro diseño permiten el uso de la tarea de detección de carriles en escenarios de piloto automático.