Acceso conjunto de drones y retroceso de satélites LEO para una red integrada espacio-aire-tierra: un enfoque basado en aprendizaje profundo por refuerzo multiagente
Autores: Huang, Xuan; Xia, Xu; Wang, Zhibo; Peng, Mugen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Acceso conjunto de drones y retroceso de satélites LEO para una red integrada espacio-aire-tierra: un enfoque basado en aprendizaje profundo por refuerzo multiagente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Servicios
Drones
Satélites
Tráfico
Emparejamiento
Optimización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La red integrada espacio-aire-suelo puede proporcionar servicios a usuarios en áreas remotas utilizando drones de plataforma de gran altitud (HAP) para apoyar un acceso estable de los usuarios y utilizando satélites de órbita terrestre baja (LEO) para proporcionar un retorno de tráfico a gran escala. Sin embargo, el movimiento rápido de los satélites LEO requiere un mantenimiento dinámico de la relación de coincidencia entre los satélites LEO y los drones HAP. Además, los diferentes tipos de tráfico generados en los drones HAP tienen niveles de valor variables. Por lo tanto, se formula un problema de coincidencia tripartita entre satélites LEO, drones HAP y tipos de tráfico que considera conjuntamente características multidimensionales como el tiempo visible restante, la condición del canal, la latencia de cambio y la capacidad de almacenamiento de tráfico, como programación no lineal entera mixta para maximizar el valor promedio del tráfico transmitido. El estado de generación de tráfico para los drones HAP se modela como una mezcla de estocasticidad y determinismo, lo que se alinea con escenarios del mundo real, planteando desafíos para los solucionadores de optimización tradicionales. Así, el problema original se desacopla en dos subproblemas independientes: coincidencia de tráfico-dron y coincidencia LEO-dron, que se abordan mediante simplificación matemática y aprendizaje por refuerzo profundo multiagente con entrenamiento centralizado y ejecución descentralizada, respectivamente. Los resultados de la simulación verifican la efectividad y superioridad del enfoque de coincidencia tripartita propuesto.
Descripción
La red integrada espacio-aire-suelo puede proporcionar servicios a usuarios en áreas remotas utilizando drones de plataforma de gran altitud (HAP) para apoyar un acceso estable de los usuarios y utilizando satélites de órbita terrestre baja (LEO) para proporcionar un retorno de tráfico a gran escala. Sin embargo, el movimiento rápido de los satélites LEO requiere un mantenimiento dinámico de la relación de coincidencia entre los satélites LEO y los drones HAP. Además, los diferentes tipos de tráfico generados en los drones HAP tienen niveles de valor variables. Por lo tanto, se formula un problema de coincidencia tripartita entre satélites LEO, drones HAP y tipos de tráfico que considera conjuntamente características multidimensionales como el tiempo visible restante, la condición del canal, la latencia de cambio y la capacidad de almacenamiento de tráfico, como programación no lineal entera mixta para maximizar el valor promedio del tráfico transmitido. El estado de generación de tráfico para los drones HAP se modela como una mezcla de estocasticidad y determinismo, lo que se alinea con escenarios del mundo real, planteando desafíos para los solucionadores de optimización tradicionales. Así, el problema original se desacopla en dos subproblemas independientes: coincidencia de tráfico-dron y coincidencia LEO-dron, que se abordan mediante simplificación matemática y aprendizaje por refuerzo profundo multiagente con entrenamiento centralizado y ejecución descentralizada, respectivamente. Los resultados de la simulación verifican la efectividad y superioridad del enfoque de coincidencia tripartita propuesto.