LiDAR Dreamer: Modelo de Mundo Eficiente para Carreras Autónomas con Codificación Cartesiana-Polar y Celdas de Espacio de Estado Livianas
Autores: Kim, Myeongjun; Park, Jong-Chan; Choi, Sang-Min; Kim, Gun-Woo
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
LiDAR Dreamer: Modelo de Mundo Eficiente para Carreras Autónomas con Codificación Cartesiana-Polar y Celdas de Espacio de Estado Livianas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Carreras autónomas
Algoritmos de percepción-decisión-control
LiDAR Dreamer
Enfoques basados en aprendizaje por refuerzo
Modelo del mundo
Eficiencia de muestreo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La carrera autónoma sirve como un campo de prueba desafiante que expone las limitaciones de los algoritmos de percepción-decisión-control en entornos extremos de alta velocidad, revelando brechas de seguridad no abordadas en la investigación existente sobre conducción autónoma. Sin embargo, las técnicas de control tradicionales (por ejemplo, FGM y MPC) y los enfoques basados en el aprendizaje por refuerzo (incluyendo variantes sin modelo y Dreamer) tienen dificultades para satisfacer simultáneamente la eficiencia de muestra, la fiabilidad de predicción y el rendimiento de control en tiempo real, lo que dificulta su aplicación en entornos de carrera de alta velocidad. Para abordar estos desafíos, proponemos LiDAR Dreamer, un nuevo modelo del mundo especializado en datos de sensores LiDAR. LiDAR Dreamer introduce tres técnicas clave: (1) preprocesamiento y codificación eficientes de nubes de puntos a través de gráficos de barras polares cartesianas, (2) Celdas de Espacio de Estado Estructuradas por Luz (LS3C) que reducen los parámetros RSSM en un 14.2% mientras preservan información dinámica clave, y (3) una función de divergencia de Distancia de Covarianza de Desplazamiento, que mejora tanto la estabilidad del aprendizaje como la expresividad. Los experimentos en entornos de simulación PyBullet F1TENTH demuestran que LiDAR Dreamer logra un rendimiento competitivo en diferentes complejidades de pista. En la pista de Austria con esquinas complejas, alcanza el 90% del rendimiento de DreamerV3 (1.14 frente a 1.27 de progreso) mientras utiliza un 81.7% menos de parámetros. En la pista más simple de Columbia, aunque los métodos sin modelo logran un rendimiento absoluto más alto, LiDAR Dreamer muestra una mejor eficiencia de muestra en comparación con los modelos base de Dreamer, convergiendo más rápido hacia un rendimiento estable. Los resultados del entorno de Treitlstrasse demuestran un rendimiento comparable a los métodos base. Además, más allá de la reducción del 14.2% en los parámetros RSSM, la pérdida de recompensa convergió de manera más estable sin picos, mejorando la eficiencia y estabilidad general del entrenamiento.
Descripción
La carrera autónoma sirve como un campo de prueba desafiante que expone las limitaciones de los algoritmos de percepción-decisión-control en entornos extremos de alta velocidad, revelando brechas de seguridad no abordadas en la investigación existente sobre conducción autónoma. Sin embargo, las técnicas de control tradicionales (por ejemplo, FGM y MPC) y los enfoques basados en el aprendizaje por refuerzo (incluyendo variantes sin modelo y Dreamer) tienen dificultades para satisfacer simultáneamente la eficiencia de muestra, la fiabilidad de predicción y el rendimiento de control en tiempo real, lo que dificulta su aplicación en entornos de carrera de alta velocidad. Para abordar estos desafíos, proponemos LiDAR Dreamer, un nuevo modelo del mundo especializado en datos de sensores LiDAR. LiDAR Dreamer introduce tres técnicas clave: (1) preprocesamiento y codificación eficientes de nubes de puntos a través de gráficos de barras polares cartesianas, (2) Celdas de Espacio de Estado Estructuradas por Luz (LS3C) que reducen los parámetros RSSM en un 14.2% mientras preservan información dinámica clave, y (3) una función de divergencia de Distancia de Covarianza de Desplazamiento, que mejora tanto la estabilidad del aprendizaje como la expresividad. Los experimentos en entornos de simulación PyBullet F1TENTH demuestran que LiDAR Dreamer logra un rendimiento competitivo en diferentes complejidades de pista. En la pista de Austria con esquinas complejas, alcanza el 90% del rendimiento de DreamerV3 (1.14 frente a 1.27 de progreso) mientras utiliza un 81.7% menos de parámetros. En la pista más simple de Columbia, aunque los métodos sin modelo logran un rendimiento absoluto más alto, LiDAR Dreamer muestra una mejor eficiencia de muestra en comparación con los modelos base de Dreamer, convergiendo más rápido hacia un rendimiento estable. Los resultados del entorno de Treitlstrasse demuestran un rendimiento comparable a los métodos base. Además, más allá de la reducción del 14.2% en los parámetros RSSM, la pérdida de recompensa convergió de manera más estable sin picos, mejorando la eficiencia y estabilidad general del entrenamiento.