Planificación de Trayectorias Óptimas en Energía para el Vehículo Aéreo No Tripulado Solar-Potenciado en Base a Aprendizaje por Refuerzo Jerárquico
Autores: Xu, Tichao; Meng, Wenyue; Zhang, Jian
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Planificación de Trayectorias Óptimas en Energía para el Vehículo Aéreo No Tripulado Solar-Potenciado en Base a Aprendizaje por Refuerzo Jerárquico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Planificación de trayectorias
Aeronaves solares
Transformación
Optimización de energía
Aprendizaje por refuerzo jerárquico
Vehículos aéreos no tripulados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La planificación de trayectorias es crucial para la resistencia de los aviones solares. El avión solar de morfología multialas puede mejorar la adquisición de energía solar a través de la deflexión de las alas, lo que a su vez incurre en pérdidas aerodinámicas, complicando el acoplamiento de energía y desafiando los métodos de planificación existentes en eficiencia y optimización a largo plazo. Este estudio presenta un método de planificación de trayectorias óptimas en energía basado en el Aprendizaje por Refuerzo Jerárquico para Vehículos Aéreos No Tripulados (VANT) solares de morfología, ejemplificado por un avión en forma de "T". Este método tiene como objetivo entrenar una política jerárquica para rastrear de manera autónoma los picos de energía. Presenta una política de decisión de alto nivel que selecciona políticas de bajo nivel apropiadas basadas en factores energéticos, que generan comandos de control como empuje, ángulos de actitud y ángulos de deflexión de alas. Properamente moldeada por funciones de recompensa y condiciones de entrenamiento, la política jerárquica puede permitir que el VANT se adapte a las condiciones de vuelo cambiantes y logre un vuelo autónomo con maximización de energía. Evaluados a través de simulaciones de vuelo de 24 horas en el solsticio de verano, los resultados demuestran que la política jerárquica puede cambiar adecuadamente sus políticas de bajo nivel durante el día y generar comandos de control en tiempo real que satisfacen los requisitos óptimos de energía. En comparación con el caso de referencia de consumo mínimo de energía, la política jerárquica propuesta logró 0.98 horas más de duración de crucero a gran altitud con carga completa y un 1.92% más de energía de batería restante después de 24 horas, demostrando capacidades superiores de optimización de energía. Además, se demostró la fuerte adaptabilidad de la política jerárquica a diferentes fechas trimestrales a través de pruebas de capacidad de generalización.
Descripción
La planificación de trayectorias es crucial para la resistencia de los aviones solares. El avión solar de morfología multialas puede mejorar la adquisición de energía solar a través de la deflexión de las alas, lo que a su vez incurre en pérdidas aerodinámicas, complicando el acoplamiento de energía y desafiando los métodos de planificación existentes en eficiencia y optimización a largo plazo. Este estudio presenta un método de planificación de trayectorias óptimas en energía basado en el Aprendizaje por Refuerzo Jerárquico para Vehículos Aéreos No Tripulados (VANT) solares de morfología, ejemplificado por un avión en forma de "T". Este método tiene como objetivo entrenar una política jerárquica para rastrear de manera autónoma los picos de energía. Presenta una política de decisión de alto nivel que selecciona políticas de bajo nivel apropiadas basadas en factores energéticos, que generan comandos de control como empuje, ángulos de actitud y ángulos de deflexión de alas. Properamente moldeada por funciones de recompensa y condiciones de entrenamiento, la política jerárquica puede permitir que el VANT se adapte a las condiciones de vuelo cambiantes y logre un vuelo autónomo con maximización de energía. Evaluados a través de simulaciones de vuelo de 24 horas en el solsticio de verano, los resultados demuestran que la política jerárquica puede cambiar adecuadamente sus políticas de bajo nivel durante el día y generar comandos de control en tiempo real que satisfacen los requisitos óptimos de energía. En comparación con el caso de referencia de consumo mínimo de energía, la política jerárquica propuesta logró 0.98 horas más de duración de crucero a gran altitud con carga completa y un 1.92% más de energía de batería restante después de 24 horas, demostrando capacidades superiores de optimización de energía. Además, se demostró la fuerte adaptabilidad de la política jerárquica a diferentes fechas trimestrales a través de pruebas de capacidad de generalización.