Diseño e Implementación de Aprendizaje por Refuerzo para Conducción Automatizada en Comparación con Control Clásico MPC

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Diseño e Implementación de Aprendizaje por Refuerzo para Conducción Automatizada en Comparación con Control Clásico MPC

Autores: Reda, Ahmad; Vásárhelyi, József

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Diseño e Implementación de Aprendizaje por Refuerzo para Conducción Automatizada en Comparación con Control Clásico MPC

Categoría

Procesos industriales

Subcategoría

Diseño de procesos industriales

Palabras clave

Enfoques de control clásico

Industria automotriz

Control predictivo de modelos

Métodos de aprendizaje automático

Aprendizaje por refuerzo

Sistemas de conducción autónoma

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 15

Citaciones: Sin citaciones

Muchos enfoques de control clásico ya han demostrado sus méritos en la industria automotriz. El control predictivo de modelos (MPC) es uno de los métodos más utilizados. Sin embargo, su eficiencia disminuye con el aumento de la complejidad del entorno de conducción. Recientemente, se han considerado métodos de aprendizaje automático como una alternativa eficiente a los enfoques de control clásicos. A pesar de la implementación exitosa del aprendizaje por refuerzo en aplicaciones del mundo real, todavía no se utiliza comúnmente en comparación con el aprendizaje supervisado y no supervisado. En este artículo, se sugiere un marco basado en el aprendizaje por refuerzo (RL) para su aplicación en sistemas de conducción autónoma para mantener una distancia segura. Además, se diseña un modelo de control basado en MPC para la misma tarea. Se comparan y discuten el comportamiento de los dos controladores. El modelo de RL entrenado se implementó en un FPGA de gama baja en bucle (matriz de puertas programable en campo en bucle). Los resultados mostraron que los dos controladores respondieron de manera eficiente a los cambios en el entorno. Específicamente, la respuesta del controlador RL fue más rápida, aproximadamente 1.75 s, que la del controlador MPC, mientras que el MPC proporcionó un mejor rendimiento en cuanto a sobrepaso (aproximadamente 1.3 m/s menos) en términos de seguir las velocidades de referencia. El modelo de aprendizaje por refuerzo mostró un comportamiento eficiente después de ser implementado en el FPGA con (ms como una desviación máxima en comparación con MATLAB Simulink.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro