logo móvil
Contáctanos

Aprendizaje por Refuerzo Profundo para la Conducción Autónoma en Amazon Web Services DeepRacer

Autores: Petryshyn, Bohdan; Postupaiev, Serhii; Ben Bari, Soufiane; Ostreika, Armantas

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Aprendizaje por Refuerzo Profundo para la Conducción Autónoma en Amazon Web Services DeepRacer


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de conducción autónoma
Sistemas de evitación de obstáculos
Aprendizaje por refuerzo
AWS DeepRacer
Modelos de conducción automática
Elección de sensores

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El desarrollo de modelos de conducción autónoma a través del aprendizaje por refuerzo ha ganado una tracción significativa. Sin embargo, desarrollar sistemas de evitación de obstáculos sigue siendo un desafío. Específicamente, optimizar los tiempos de finalización de rutas mientras se navega por obstáculos es un área de investigación poco explorada. Amazon Web Services (AWS) DeepRacer surge como una infraestructura poderosa para la ingeniería y el análisis de modelos autónomos, proporcionando una base sólida para abordar estas complejidades. Esta investigación investiga la viabilidad de entrenar modelos de conducción autónoma de extremo a extremo centrados en la evitación de obstáculos utilizando aprendizaje por refuerzo en la plataforma de coches de carrera autónomos AWS DeepRacer. Se lleva a cabo una revisión exhaustiva de la literatura sobre metodologías de conducción autónoma y arquitecturas de modelos de aprendizaje automático, con un enfoque particular en la evitación de objetos, seguida de experimentación práctica y análisis de datos de entrenamiento. Además, se comparan el impacto de la elección de sensores, la función de recompensa, los espacios de acción y el tiempo de entrenamiento en la tarea autónoma de evitación de obstáculos. Los resultados del experimento de la mejor configuración demuestran una mejora significativa en el rendimiento de evitación de obstáculos en comparación con la configuración base, con una disminución del 95.8% en la tasa de colisiones, mientras que se tarda aproximadamente un 79% menos en completar el circuito de prueba.

Otros recursos que podrían interesarte

Temas Virtualpro