Análisis de sensibilidad del reconocimiento de señales de tráfico ante alteraciones de imagen y tamaño del conjunto de datos de entrenamiento
Autores: Rubio, Arthur; Demoor, Guillaume; Chalmé, Simon; Sutton-Charani, Nicolas; Magnier, Baptiste
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Análisis de sensibilidad del reconocimiento de señales de tráfico ante alteraciones de imagen y tamaño del conjunto de datos de entrenamiento
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Señales de tráfico
Conducción autónoma
Redes Neuronales Convolucionales
Modelos de Aprendizaje Automático
Modelos de Aprendizaje Profundo
Datos de entrenamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Clasificar con precisión las señales de tráfico es crucial para la conducción autónoma debido a las altas apuestas involucradas en garantizar la seguridad y el cumplimiento. A medida que las Redes Neuronales Convolucionales (CNN) han reemplazado en gran medida a los modelos tradicionales de Aprendizaje Automático en este ámbito, la demanda de datos de entrenamiento sustanciales ha aumentado. Este estudio tiene como objetivo comparar el rendimiento de los modelos clásicos de Aprendizaje Automático (ML) y los modelos de Aprendizaje Profundo (DL) bajo diferentes cantidades de datos de entrenamiento, centrándose particularmente en señales alteradas para imitar condiciones del mundo real. Evaluamos tres modelos clásicos: Máquina de Vectores de Soporte (SVM), Bosque Aleatorio y Análisis Discriminante Lineal (LDA), y un modelo de Aprendizaje Profundo: Red Neuronal Convolucional (CNN). Utilizando el conjunto de datos del Banco de Pruebas de Reconocimiento de Señales de Tráfico Alemanas (GTSRB), que incluye aproximadamente 40,000 señales de tráfico alemanas, introdujimos alteraciones digitales para simular condiciones como el desgaste ambiental o el vandalismo. Además, se utilizó el descriptor de Histograma de Gradientes Orientados (HOG) para ayudar a los modelos clásicos. Se emplearon optimización bayesiana y validación cruzada k-fold para el ajuste fino del modelo y la evaluación del rendimiento. Nuestros hallazgos revelan un umbral en los datos de entrenamiento más allá del cual la precisión se estabiliza. Los modelos clásicos mostraron una disminución lineal en el rendimiento bajo un aumento de alteraciones, mientras que las CNN, a pesar de ser más robustas a las alteraciones, no superaron significativamente a los modelos clásicos en precisión general. En última instancia, los modelos clásicos de Aprendizaje Automático demostraron un rendimiento comparable al de las CNN en ciertas condiciones, lo que sugiere que se puede lograr una clasificación efectiva de señales de tráfico con enfoques menos intensivos en computación.
Descripción
Clasificar con precisión las señales de tráfico es crucial para la conducción autónoma debido a las altas apuestas involucradas en garantizar la seguridad y el cumplimiento. A medida que las Redes Neuronales Convolucionales (CNN) han reemplazado en gran medida a los modelos tradicionales de Aprendizaje Automático en este ámbito, la demanda de datos de entrenamiento sustanciales ha aumentado. Este estudio tiene como objetivo comparar el rendimiento de los modelos clásicos de Aprendizaje Automático (ML) y los modelos de Aprendizaje Profundo (DL) bajo diferentes cantidades de datos de entrenamiento, centrándose particularmente en señales alteradas para imitar condiciones del mundo real. Evaluamos tres modelos clásicos: Máquina de Vectores de Soporte (SVM), Bosque Aleatorio y Análisis Discriminante Lineal (LDA), y un modelo de Aprendizaje Profundo: Red Neuronal Convolucional (CNN). Utilizando el conjunto de datos del Banco de Pruebas de Reconocimiento de Señales de Tráfico Alemanas (GTSRB), que incluye aproximadamente 40,000 señales de tráfico alemanas, introdujimos alteraciones digitales para simular condiciones como el desgaste ambiental o el vandalismo. Además, se utilizó el descriptor de Histograma de Gradientes Orientados (HOG) para ayudar a los modelos clásicos. Se emplearon optimización bayesiana y validación cruzada k-fold para el ajuste fino del modelo y la evaluación del rendimiento. Nuestros hallazgos revelan un umbral en los datos de entrenamiento más allá del cual la precisión se estabiliza. Los modelos clásicos mostraron una disminución lineal en el rendimiento bajo un aumento de alteraciones, mientras que las CNN, a pesar de ser más robustas a las alteraciones, no superaron significativamente a los modelos clásicos en precisión general. En última instancia, los modelos clásicos de Aprendizaje Automático demostraron un rendimiento comparable al de las CNN en ciertas condiciones, lo que sugiere que se puede lograr una clasificación efectiva de señales de tráfico con enfoques menos intensivos en computación.