Aprendizaje de Representación para la Conducción Autónoma Basada en Visión a través de Modelado Probabilístico del Mundo
Autores: Chen, Haoqiang; Liu, Yadong; Hu, Dewen
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprendizaje de Representación para la Conducción Autónoma Basada en Visión a través de Modelado Probabilístico del Mundo
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Aprendizaje de representación
Conducción autónoma
Modelos del mundo
BYOL-Drive
Auto-supervisado
Imágenes de cámara monocular
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
El aprendizaje de representaciones juega un papel vital en la conducción autónoma al extraer características significativas de las entradas sensoriales en bruto. Los modelos del mundo emergen como un enfoque efectivo para el aprendizaje de representaciones al capturar características predictivas que pueden anticipar múltiples futuros posibles, lo que es particularmente adecuado para escenarios de conducción. Sin embargo, los enfoques actuales de modelos del mundo enfrentan dos limitaciones críticas: primero, los métodos convencionales dependen en gran medida de la inferencia variacional computacionalmente costosa que requiere decodificación de nuevo al espacio de observación de alta dimensión. En segundo lugar, los sistemas de conducción autónoma de extremo a extremo actuales exigen una gran cantidad de datos etiquetados para el entrenamiento, lo que resulta en costos de anotación prohibitivos. Para abordar estos desafíos, presentamos BYOL-Drive, un método novedoso que primero introduce el paradigma de aprendizaje de representaciones auto-supervisado BYOL (Bootstrap Your Own Latent) para implementar la modelización del mundo. Nuestro método elimina la carga computacional de la decodificación del espacio de observación mientras requiere sustancialmente menos datos etiquetados en comparación con los enfoques convencionales. Además, nuestro modelo solo se basa en imágenes de cámara monocular como entrada, lo que facilita su implementación y generalización. Basado en esta representación aprendida, los experimentos en el estándar de referencia cerrado CARLA demuestran que nuestro BYOL-Drive logra un rendimiento competitivo con una eficiencia computacional mejorada y requisitos de anotación significativamente reducidos en comparación con los métodos de última generación. Nuestro trabajo contribuye al desarrollo de la conducción autónoma de extremo a extremo.
Descripción
El aprendizaje de representaciones juega un papel vital en la conducción autónoma al extraer características significativas de las entradas sensoriales en bruto. Los modelos del mundo emergen como un enfoque efectivo para el aprendizaje de representaciones al capturar características predictivas que pueden anticipar múltiples futuros posibles, lo que es particularmente adecuado para escenarios de conducción. Sin embargo, los enfoques actuales de modelos del mundo enfrentan dos limitaciones críticas: primero, los métodos convencionales dependen en gran medida de la inferencia variacional computacionalmente costosa que requiere decodificación de nuevo al espacio de observación de alta dimensión. En segundo lugar, los sistemas de conducción autónoma de extremo a extremo actuales exigen una gran cantidad de datos etiquetados para el entrenamiento, lo que resulta en costos de anotación prohibitivos. Para abordar estos desafíos, presentamos BYOL-Drive, un método novedoso que primero introduce el paradigma de aprendizaje de representaciones auto-supervisado BYOL (Bootstrap Your Own Latent) para implementar la modelización del mundo. Nuestro método elimina la carga computacional de la decodificación del espacio de observación mientras requiere sustancialmente menos datos etiquetados en comparación con los enfoques convencionales. Además, nuestro modelo solo se basa en imágenes de cámara monocular como entrada, lo que facilita su implementación y generalización. Basado en esta representación aprendida, los experimentos en el estándar de referencia cerrado CARLA demuestran que nuestro BYOL-Drive logra un rendimiento competitivo con una eficiencia computacional mejorada y requisitos de anotación significativamente reducidos en comparación con los métodos de última generación. Nuestro trabajo contribuye al desarrollo de la conducción autónoma de extremo a extremo.