El aprendizaje por refuerzo derivó maniobras acrobáticas de alta alfa para operación de alas fijas en espacios confinados
Autores: Clarke, Robert; Fletcher, Liam; East, Sebastian; Richardson, Thomas
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
El aprendizaje por refuerzo derivó maniobras acrobáticas de alta alfa para operación de alas fijas en espacios confinados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aprendizaje por refuerzo
Drones
Modelo de aeronave
Maniobras de alta alfa
Controladores basados en redes neuronales
Espacios confinados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El aprendizaje por refuerzo se ha utilizado en una variedad de tareas de control para drones, incluido, en trabajos anteriores en la Universidad de Bristol, en maniobras de aterrizaje con aeronaves de ala en flecha. En este documento, se presenta un nuevo modelo de aeronave que representa el vuelo a ángulos de ataque muy altos donde los modelos aerodinámicos son altamente no lineales. El modelo se emplea para desarrollar maniobras de alto ángulo de ataque, utilizando el aprendizaje por refuerzo para explotar las no linealidades en el borde del sobre vuelo, lo que permite operaciones de alas fijas en espacios estrechamente confinados. También se demuestra el entrenamiento de redes para múltiples maniobras. Se muestra que el enfoque genera controladores que aprovechan al máximo la capacidad de la aeronave. Se sugiere que una combinación de estos controladores basados en redes neuronales, junto con el control predictivo de modelos clásicos, podría utilizarse para operar de manera eficiente dentro del régimen de vuelo de baja alfa y, sin embargo, responder rápidamente en espacios confinados donde se requieren maniobras ágiles de alto alfa.
Descripción
El aprendizaje por refuerzo se ha utilizado en una variedad de tareas de control para drones, incluido, en trabajos anteriores en la Universidad de Bristol, en maniobras de aterrizaje con aeronaves de ala en flecha. En este documento, se presenta un nuevo modelo de aeronave que representa el vuelo a ángulos de ataque muy altos donde los modelos aerodinámicos son altamente no lineales. El modelo se emplea para desarrollar maniobras de alto ángulo de ataque, utilizando el aprendizaje por refuerzo para explotar las no linealidades en el borde del sobre vuelo, lo que permite operaciones de alas fijas en espacios estrechamente confinados. También se demuestra el entrenamiento de redes para múltiples maniobras. Se muestra que el enfoque genera controladores que aprovechan al máximo la capacidad de la aeronave. Se sugiere que una combinación de estos controladores basados en redes neuronales, junto con el control predictivo de modelos clásicos, podría utilizarse para operar de manera eficiente dentro del régimen de vuelo de baja alfa y, sin embargo, responder rápidamente en espacios confinados donde se requieren maniobras ágiles de alto alfa.