logo móvil
Contáctanos

Diseño e Implementación de Aprendizaje por Refuerzo para Conducción Automatizada en Comparación con Control Clásico MPC

Autores: Reda, Ahmad; Vásárhelyi, József

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Diseño e Implementación de Aprendizaje por Refuerzo para Conducción Automatizada en Comparación con Control Clásico MPC


Categoría

Procesos industriales

Subcategoría

Diseño de procesos industriales

Palabras clave

Enfoques de control clásico
Industria automotriz
Control predictivo de modelos
Métodos de aprendizaje automático
Aprendizaje por refuerzo
Sistemas de conducción autónoma

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 15

Citaciones: Sin citaciones


Descripción
Muchos enfoques de control clásico ya han demostrado sus méritos en la industria automotriz. El control predictivo de modelos (MPC) es uno de los métodos más utilizados. Sin embargo, su eficiencia disminuye con el aumento de la complejidad del entorno de conducción. Recientemente, se han considerado métodos de aprendizaje automático como una alternativa eficiente a los enfoques de control clásicos. A pesar de la implementación exitosa del aprendizaje por refuerzo en aplicaciones del mundo real, todavía no se utiliza comúnmente en comparación con el aprendizaje supervisado y no supervisado. En este artículo, se sugiere un marco basado en el aprendizaje por refuerzo (RL) para su aplicación en sistemas de conducción autónoma para mantener una distancia segura. Además, se diseña un modelo de control basado en MPC para la misma tarea. Se comparan y discuten el comportamiento de los dos controladores. El modelo de RL entrenado se implementó en un FPGA de gama baja en bucle (matriz de puertas programable en campo en bucle). Los resultados mostraron que los dos controladores respondieron de manera eficiente a los cambios en el entorno. Específicamente, la respuesta del controlador RL fue más rápida, aproximadamente 1.75 s, que la del controlador MPC, mientras que el MPC proporcionó un mejor rendimiento en cuanto a sobrepaso (aproximadamente 1.3 m/s menos) en términos de seguir las velocidades de referencia. El modelo de aprendizaje por refuerzo mostró un comportamiento eficiente después de ser implementado en el FPGA con (ms como una desviación máxima en comparación con MATLAB Simulink.

Otros recursos que podrían interesarte

Temas Virtualpro