Aprendizaje por Refuerzo Basado en Acción Híbrida Segura para la Toma de Decisiones y Control en Cambios de Carril Discrecionales

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprendizaje por Refuerzo Basado en Acción Híbrida Segura para la Toma de Decisiones y Control en Cambios de Carril Discrecionales

Autores: Xu, Ruichen; Xu, Jinming; Liu, Xiao; Lin, Yuan

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Aprendizaje por Refuerzo Basado en Acción Híbrida Segura para la Toma de Decisiones y Control en Cambios de Carril Discrecionales

Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Cambio de carril autónomo

Sistemas avanzados de asistencia al conductor

Eficiencia del tráfico

Accidentes

Vehículos autónomos

Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones

El cambio de carril autónomo, una característica clave de los sistemas avanzados de asistencia al conductor, puede mejorar la eficiencia del tráfico y reducir la incidencia de accidentes. Sin embargo, la conducción segura de vehículos autónomos sigue siendo un desafío en entornos complejos. Cómo realizar un cambio de carril seguro y apropiado es un tema popular de investigación en el campo de la conducción autónoma. Actualmente, pocos artículos consideran la seguridad del aprendizaje por refuerzo en escenarios de cambio de carril discrecional. Introducimos el aprendizaje por refuerzo híbrido de acciones seguras en el cambio de carril discrecional por primera vez y proponemos el algoritmo Parameterized Soft Actor-Critic con PID Lagrangiano (PASAC-PIDLag). Además, realizamos un análisis comparativo con el Parameterized Soft Actor-Critic (PASAC), que es una versión insegura del PASAC-PIDLag. Ambos algoritmos se utilizan para entrenar la estrategia de cambio de carril para generar tanto decisiones de cambio de carril discretas como aceleración longitudinal continua del vehículo. Nuestros resultados de simulación indican que, con una densidad de tráfico de 15 vehículos por kilómetro (15 veh/km), el algoritmo PASAC-PIDLag exhibe una seguridad superior con una tasa de colisión del 0%, superando al algoritmo PASAC, que tiene una tasa de colisión del 1%. Las evaluaciones de generalización revelan que, en niveles bajos de densidad de tráfico, tanto los algoritmos PASAC-PIDLag como PASAC son competentes para alcanzar tasas de colisión cero. Sin embargo, en niveles altos de densidad de tráfico, aunque ambos algoritmos resultan en colisiones, PASAC-PIDLag tiene una tasa de colisión mucho más baja que PASAC.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro