Comunicaciones inalámbricas robustas orientadas a UAV a través de aprendizaje profundo por refuerzo multiagente para optimizar la cobertura de usuarios
Autores: Khan, Mahfizur Rahman; Premkumar, Gowtham Raj Veeraswamy; Van Scoy, Bryan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Comunicaciones inalámbricas robustas orientadas a UAV a través de aprendizaje profundo por refuerzo multiagente para optimizar la cobertura de usuarios
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Estudio
Drones
Optimización
Aprendizaje profundo por refuerzo
Enfoque centralizado
Técnica descentralizada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este estudio, desplegamos drones como estaciones base dinámicas para abordar el problema de optimizar la cobertura de usuarios en áreas sin infraestructura de estaciones base fijas. Para optimizar la colocación de drones, empleamos Deep Q-Learning, comenzando con un enfoque centralizado debido a su simplicidad y facilidad de entrenamiento. En este enfoque centralizado, todos los drones se entrenan simultáneamente. También empleamos una técnica descentralizada en la que cada drone actúa de manera autónoma mientras comparte una red neuronal común, lo que permite un aprendizaje individualizado. Además, exploramos los impactos del interferencia en los UAV y proporcionamos un enfoque confiable para mitigar esta interferencia. Para aumentar la robustez, empleamos distribuciones de usuarios estocásticas, que entrenan nuestra política para responder con éxito a una amplia gama de situaciones de usuarios.
Descripción
En este estudio, desplegamos drones como estaciones base dinámicas para abordar el problema de optimizar la cobertura de usuarios en áreas sin infraestructura de estaciones base fijas. Para optimizar la colocación de drones, empleamos Deep Q-Learning, comenzando con un enfoque centralizado debido a su simplicidad y facilidad de entrenamiento. En este enfoque centralizado, todos los drones se entrenan simultáneamente. También empleamos una técnica descentralizada en la que cada drone actúa de manera autónoma mientras comparte una red neuronal común, lo que permite un aprendizaje individualizado. Además, exploramos los impactos del interferencia en los UAV y proporcionamos un enfoque confiable para mitigar esta interferencia. Para aumentar la robustez, empleamos distribuciones de usuarios estocásticas, que entrenan nuestra política para responder con éxito a una amplia gama de situaciones de usuarios.