Diseño e Implementación de Aprendizaje por Refuerzo para Conducción Automatizada en Comparación con Control Clásico MPC
Autores: Reda, Ahmad; Vásárhelyi, József
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Diseño e Implementación de Aprendizaje por Refuerzo para Conducción Automatizada en Comparación con Control Clásico MPC
Categoría
Procesos industriales
Subcategoría
Diseño de procesos industriales
Palabras clave
Enfoques de control clásico
Industria automotriz
Control predictivo de modelos
Métodos de aprendizaje automático
Aprendizaje por refuerzo
Sistemas de conducción autónoma
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
Muchos enfoques de control clásico ya han demostrado sus méritos en la industria automotriz. El control predictivo de modelos (MPC) es uno de los métodos más utilizados. Sin embargo, su eficiencia disminuye con el aumento de la complejidad del entorno de conducción. Recientemente, se han considerado métodos de aprendizaje automático como una alternativa eficiente a los enfoques de control clásicos. A pesar de la implementación exitosa del aprendizaje por refuerzo en aplicaciones del mundo real, todavía no se utiliza comúnmente en comparación con el aprendizaje supervisado y no supervisado. En este artículo, se sugiere un marco basado en el aprendizaje por refuerzo (RL) para su aplicación en sistemas de conducción autónoma para mantener una distancia segura. Además, se diseña un modelo de control basado en MPC para la misma tarea. Se comparan y discuten el comportamiento de los dos controladores. El modelo de RL entrenado se implementó en un FPGA de gama baja en bucle (matriz de puertas programable en campo en bucle). Los resultados mostraron que los dos controladores respondieron de manera eficiente a los cambios en el entorno. Específicamente, la respuesta del controlador RL fue más rápida, aproximadamente 1.75 s, que la del controlador MPC, mientras que el MPC proporcionó un mejor rendimiento en cuanto a sobrepaso (aproximadamente 1.3 m/s menos) en términos de seguir las velocidades de referencia. El modelo de aprendizaje por refuerzo mostró un comportamiento eficiente después de ser implementado en el FPGA con (ms como una desviación máxima en comparación con MATLAB Simulink.
Descripción
Muchos enfoques de control clásico ya han demostrado sus méritos en la industria automotriz. El control predictivo de modelos (MPC) es uno de los métodos más utilizados. Sin embargo, su eficiencia disminuye con el aumento de la complejidad del entorno de conducción. Recientemente, se han considerado métodos de aprendizaje automático como una alternativa eficiente a los enfoques de control clásicos. A pesar de la implementación exitosa del aprendizaje por refuerzo en aplicaciones del mundo real, todavía no se utiliza comúnmente en comparación con el aprendizaje supervisado y no supervisado. En este artículo, se sugiere un marco basado en el aprendizaje por refuerzo (RL) para su aplicación en sistemas de conducción autónoma para mantener una distancia segura. Además, se diseña un modelo de control basado en MPC para la misma tarea. Se comparan y discuten el comportamiento de los dos controladores. El modelo de RL entrenado se implementó en un FPGA de gama baja en bucle (matriz de puertas programable en campo en bucle). Los resultados mostraron que los dos controladores respondieron de manera eficiente a los cambios en el entorno. Específicamente, la respuesta del controlador RL fue más rápida, aproximadamente 1.75 s, que la del controlador MPC, mientras que el MPC proporcionó un mejor rendimiento en cuanto a sobrepaso (aproximadamente 1.3 m/s menos) en términos de seguir las velocidades de referencia. El modelo de aprendizaje por refuerzo mostró un comportamiento eficiente después de ser implementado en el FPGA con (ms como una desviación máxima en comparación con MATLAB Simulink.