logo móvil
Contáctanos

Aprendizaje de Representación para la Conducción Autónoma Basada en Visión a través de Modelado Probabilístico del Mundo

Autores: Chen, Haoqiang; Liu, Yadong; Hu, Dewen

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Aprendizaje de Representación para la Conducción Autónoma Basada en Visión a través de Modelado Probabilístico del Mundo


Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Aprendizaje de representación
Conducción autónoma
Modelos del mundo
BYOL-Drive
Auto-supervisado
Imágenes de cámara monocular

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 17

Citaciones: Sin citaciones


Descripción
El aprendizaje de representaciones juega un papel vital en la conducción autónoma al extraer características significativas de las entradas sensoriales en bruto. Los modelos del mundo emergen como un enfoque efectivo para el aprendizaje de representaciones al capturar características predictivas que pueden anticipar múltiples futuros posibles, lo que es particularmente adecuado para escenarios de conducción. Sin embargo, los enfoques actuales de modelos del mundo enfrentan dos limitaciones críticas: primero, los métodos convencionales dependen en gran medida de la inferencia variacional computacionalmente costosa que requiere decodificación de nuevo al espacio de observación de alta dimensión. En segundo lugar, los sistemas de conducción autónoma de extremo a extremo actuales exigen una gran cantidad de datos etiquetados para el entrenamiento, lo que resulta en costos de anotación prohibitivos. Para abordar estos desafíos, presentamos BYOL-Drive, un método novedoso que primero introduce el paradigma de aprendizaje de representaciones auto-supervisado BYOL (Bootstrap Your Own Latent) para implementar la modelización del mundo. Nuestro método elimina la carga computacional de la decodificación del espacio de observación mientras requiere sustancialmente menos datos etiquetados en comparación con los enfoques convencionales. Además, nuestro modelo solo se basa en imágenes de cámara monocular como entrada, lo que facilita su implementación y generalización. Basado en esta representación aprendida, los experimentos en el estándar de referencia cerrado CARLA demuestran que nuestro BYOL-Drive logra un rendimiento competitivo con una eficiencia computacional mejorada y requisitos de anotación significativamente reducidos en comparación con los métodos de última generación. Nuestro trabajo contribuye al desarrollo de la conducción autónoma de extremo a extremo.

Otros recursos que podrían interesarte

Temas Virtualpro