logo móvil
Contáctanos

Control de Pitch de Vehículo Aéreo No Tripulado Usando Aprendizaje por Refuerzo Profundo con Acciones Discretas en Prueba de Túnel de Viento

Autores: Wada, Daichi; Araujo-Estrada, Sergio A.; Windsor, Shane

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Control de Pitch de Vehículo Aéreo No Tripulado Usando Aprendizaje por Refuerzo Profundo con Acciones Discretas en Prueba de Túnel de Viento


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Aprendizaje profundo por refuerzo
Controlador de actitud
Vehículos aéreos no tripulados de ala fija
Pruebas en túnel de viento
Comandos de ángulo de ataque
Maniobras de elevador

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 20

Citaciones: Sin citaciones


Descripción
El aprendizaje profundo por refuerzo es un método prometedor para entrenar un controlador de actitud no lineal para vehículos aéreos no tripulados de ala fija. Hasta ahora, los estudios de prueba de concepto han demostrado un control de actitud exitoso en simulación. Sin embargo, no se han realizado investigaciones experimentales detalladas. Este estudio aplicó el aprendizaje profundo por refuerzo para el control de inclinación de un grado de libertad en pruebas en túnel de viento con el objetivo de obtener comprensiones prácticas de la aplicación del control de actitud. Se diseñaron tres controladores con diferentes opciones de acción discreta, es decir, ángulos de elevador. Los controladores con tasas de acción más grandes mostraron un mejor rendimiento en términos de seguimiento de comandos de ángulo de ataque. Los errores cuadráticos medios para el seguimiento de comandos de ángulo de ataque disminuyeron de 3.42 grados a 1.99 grados a medida que la tasa máxima de acción aumentó de 10 grados/s a 50 grados/s. La comparación entre los resultados experimentales y de simulación mostró que el controlador con una tasa de acción más pequeña experimentó el efecto de fricción, y los controladores con tasas de acción más grandes experimentaron comportamientos fluctuantes en las maniobras del elevador debido al retraso. La investigación del efecto de la fricción y el retraso en el control de inclinación destacó la importancia de realizar experimentos para comprender el rendimiento real del control, específicamente cuando los controladores fueron entrenados con un modelo de baja fidelidad.

Otros recursos que podrían interesarte

Temas Virtualpro