Agregación de Datos Impulsada por la Incertidumbre para el Aprendizaje por Imitación en Vehículos Autónomos
Autores: Wang, Changquan; Wang, Yun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Agregación de Datos Impulsada por la Incertidumbre para el Aprendizaje por Imitación en Vehículos Autónomos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje por imitación
Conducción autónoma
Cambio de covariables
Marco DAgger
Estimación de incertidumbre bayesiana
Inferencia variacional de campo medio
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El aprendizaje por imitación ha mostrado promesas para la conducción autónoma, pero sufre de un cambio de covariables, donde la política tiene un rendimiento deficiente en entornos no vistos. DAgger es un enfoque popular que aborda esto aprovechando las demostraciones de expertos. Sin embargo, las visitas frecuentes de DAgger a estados subóptimos pueden llevar a varios desafíos. Este artículo propone un nuevo marco DAgger que integra la estimación de incertidumbre bayesiana a través de la inferencia variacional de campo medio (MFVI) para abordar este problema. MFVI proporciona estimaciones de incertidumbre mejor calibradas en comparación con métodos anteriores. Durante el entrenamiento, el marco identifica tanto estados inciertos como críticos, consultando al experto solo para estos estados. Esta recolección de datos dirigida reduce la carga sobre el experto y mejora la eficiencia de los datos. Las evaluaciones en el simulador CARLA demuestran que nuestro enfoque supera a los métodos existentes, destacando la efectividad de la estimación de incertidumbre bayesiana y la agregación de datos dirigida para el aprendizaje por imitación en la conducción autónoma.
Descripción
El aprendizaje por imitación ha mostrado promesas para la conducción autónoma, pero sufre de un cambio de covariables, donde la política tiene un rendimiento deficiente en entornos no vistos. DAgger es un enfoque popular que aborda esto aprovechando las demostraciones de expertos. Sin embargo, las visitas frecuentes de DAgger a estados subóptimos pueden llevar a varios desafíos. Este artículo propone un nuevo marco DAgger que integra la estimación de incertidumbre bayesiana a través de la inferencia variacional de campo medio (MFVI) para abordar este problema. MFVI proporciona estimaciones de incertidumbre mejor calibradas en comparación con métodos anteriores. Durante el entrenamiento, el marco identifica tanto estados inciertos como críticos, consultando al experto solo para estos estados. Esta recolección de datos dirigida reduce la carga sobre el experto y mejora la eficiencia de los datos. Las evaluaciones en el simulador CARLA demuestran que nuestro enfoque supera a los métodos existentes, destacando la efectividad de la estimación de incertidumbre bayesiana y la agregación de datos dirigida para el aprendizaje por imitación en la conducción autónoma.