Aprendizaje de Representación para la Conducción Autónoma Basada en Visión a través de Modelado Probabilístico del Mundo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprendizaje de Representación para la Conducción Autónoma Basada en Visión a través de Modelado Probabilístico del Mundo

Autores: Chen, Haoqiang; Liu, Yadong; Hu, Dewen

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Aprendizaje de Representación para la Conducción Autónoma Basada en Visión a través de Modelado Probabilístico del Mundo

Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Aprendizaje de representación

Conducción autónoma

Modelos del mundo

BYOL-Drive

Auto-supervisado

Imágenes de cámara monocular

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 17

Citaciones: Sin citaciones

El aprendizaje de representaciones juega un papel vital en la conducción autónoma al extraer características significativas de las entradas sensoriales en bruto. Los modelos del mundo emergen como un enfoque efectivo para el aprendizaje de representaciones al capturar características predictivas que pueden anticipar múltiples futuros posibles, lo que es particularmente adecuado para escenarios de conducción. Sin embargo, los enfoques actuales de modelos del mundo enfrentan dos limitaciones críticas: primero, los métodos convencionales dependen en gran medida de la inferencia variacional computacionalmente costosa que requiere decodificación de nuevo al espacio de observación de alta dimensión. En segundo lugar, los sistemas de conducción autónoma de extremo a extremo actuales exigen una gran cantidad de datos etiquetados para el entrenamiento, lo que resulta en costos de anotación prohibitivos. Para abordar estos desafíos, presentamos BYOL-Drive, un método novedoso que primero introduce el paradigma de aprendizaje de representaciones auto-supervisado BYOL (Bootstrap Your Own Latent) para implementar la modelización del mundo. Nuestro método elimina la carga computacional de la decodificación del espacio de observación mientras requiere sustancialmente menos datos etiquetados en comparación con los enfoques convencionales. Además, nuestro modelo solo se basa en imágenes de cámara monocular como entrada, lo que facilita su implementación y generalización. Basado en esta representación aprendida, los experimentos en el estándar de referencia cerrado CARLA demuestran que nuestro BYOL-Drive logra un rendimiento competitivo con una eficiencia computacional mejorada y requisitos de anotación significativamente reducidos en comparación con los métodos de última generación. Nuestro trabajo contribuye al desarrollo de la conducción autónoma de extremo a extremo.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro