Control de Pitch de Vehículo Aéreo No Tripulado Usando Aprendizaje por Refuerzo Profundo con Acciones Discretas en Prueba de Túnel de Viento
Autores: Wada, Daichi; Araujo-Estrada, Sergio A.; Windsor, Shane
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Control de Pitch de Vehículo Aéreo No Tripulado Usando Aprendizaje por Refuerzo Profundo con Acciones Discretas en Prueba de Túnel de Viento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Aprendizaje profundo por refuerzo
Controlador de actitud
Vehículos aéreos no tripulados de ala fija
Pruebas en túnel de viento
Comandos de ángulo de ataque
Maniobras de elevador
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
El aprendizaje profundo por refuerzo es un método prometedor para entrenar un controlador de actitud no lineal para vehículos aéreos no tripulados de ala fija. Hasta ahora, los estudios de prueba de concepto han demostrado un control de actitud exitoso en simulación. Sin embargo, no se han realizado investigaciones experimentales detalladas. Este estudio aplicó el aprendizaje profundo por refuerzo para el control de inclinación de un grado de libertad en pruebas en túnel de viento con el objetivo de obtener comprensiones prácticas de la aplicación del control de actitud. Se diseñaron tres controladores con diferentes opciones de acción discreta, es decir, ángulos de elevador. Los controladores con tasas de acción más grandes mostraron un mejor rendimiento en términos de seguimiento de comandos de ángulo de ataque. Los errores cuadráticos medios para el seguimiento de comandos de ángulo de ataque disminuyeron de 3.42 grados a 1.99 grados a medida que la tasa máxima de acción aumentó de 10 grados/s a 50 grados/s. La comparación entre los resultados experimentales y de simulación mostró que el controlador con una tasa de acción más pequeña experimentó el efecto de fricción, y los controladores con tasas de acción más grandes experimentaron comportamientos fluctuantes en las maniobras del elevador debido al retraso. La investigación del efecto de la fricción y el retraso en el control de inclinación destacó la importancia de realizar experimentos para comprender el rendimiento real del control, específicamente cuando los controladores fueron entrenados con un modelo de baja fidelidad.
Descripción
El aprendizaje profundo por refuerzo es un método prometedor para entrenar un controlador de actitud no lineal para vehículos aéreos no tripulados de ala fija. Hasta ahora, los estudios de prueba de concepto han demostrado un control de actitud exitoso en simulación. Sin embargo, no se han realizado investigaciones experimentales detalladas. Este estudio aplicó el aprendizaje profundo por refuerzo para el control de inclinación de un grado de libertad en pruebas en túnel de viento con el objetivo de obtener comprensiones prácticas de la aplicación del control de actitud. Se diseñaron tres controladores con diferentes opciones de acción discreta, es decir, ángulos de elevador. Los controladores con tasas de acción más grandes mostraron un mejor rendimiento en términos de seguimiento de comandos de ángulo de ataque. Los errores cuadráticos medios para el seguimiento de comandos de ángulo de ataque disminuyeron de 3.42 grados a 1.99 grados a medida que la tasa máxima de acción aumentó de 10 grados/s a 50 grados/s. La comparación entre los resultados experimentales y de simulación mostró que el controlador con una tasa de acción más pequeña experimentó el efecto de fricción, y los controladores con tasas de acción más grandes experimentaron comportamientos fluctuantes en las maniobras del elevador debido al retraso. La investigación del efecto de la fricción y el retraso en el control de inclinación destacó la importancia de realizar experimentos para comprender el rendimiento real del control, específicamente cuando los controladores fueron entrenados con un modelo de baja fidelidad.