Método de Optimización de Potencia Basado en Actor-Crítico Suave para Sistemas de Carga Inalámbrica de UAV
Autores: Dai, Zhuoyue; Yang, Yongmin; Luo, Yanting; Lin, Zhilong; Yang, Guanpeng
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Método de Optimización de Potencia Basado en Actor-Crítico Suave para Sistemas de Carga Inalámbrica de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Optimización de potencia
Carga inalámbrica
Vehículos aéreos no tripulados
Método basado en datos
Algoritmo Soft Actor-Critic
Múltiples transmisores y un solo receptor
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Mantener una alta entrega de potencia bajo posiciones de aterrizaje inciertas es un desafío clave para la carga inalámbrica de vehículos aéreos no tripulados (UAV). Este documento presenta un método de optimización de potencia basado en datos, utilizando el algoritmo Soft Actor-Critic para sistemas de transferencia de potencia inalámbrica de múltiples transmisores y un solo receptor (MTSR-WPT). Para apoyar un aprendizaje efectivo sin identificación de parámetros en línea explícita, se construye una representación de estado de corriente dual informada por la física a partir de respuestas de corriente medibles, combinando una corriente de fase cero con la respuesta de corriente bajo el comando de fase aplicado. El agente se entrena utilizando una recompensa definida directamente a partir de la potencia de carga normalizada, y las fases de voltaje del transmisor sirven como acciones de control. En simulaciones de un sistema de cinco transmisores, la política aprendida logra aproximadamente el 97% de la potencia máxima teórica en la región de entrenamiento y alrededor del 96% en la región de evaluación ampliada. Estudios adicionales de robustez muestran un rendimiento sólido bajo ruido de medición moderado y una recuperación sustancial bajo desajuste del modelo después de un breve ajuste fino. La validación experimental en un prototipo físico confirma la efectividad del método, logrando una mejora promedio de potencia del 188% desde una línea base de fase cero y alcanzando el 87% de la potencia máxima medida en la plataforma de hardware. Estos resultados apoyan el método propuesto como una alternativa práctica basada en datos para la optimización de potencia MTSR-WPT dependiente del modelo para la carga inalámbrica de UAV.
Descripción
Mantener una alta entrega de potencia bajo posiciones de aterrizaje inciertas es un desafío clave para la carga inalámbrica de vehículos aéreos no tripulados (UAV). Este documento presenta un método de optimización de potencia basado en datos, utilizando el algoritmo Soft Actor-Critic para sistemas de transferencia de potencia inalámbrica de múltiples transmisores y un solo receptor (MTSR-WPT). Para apoyar un aprendizaje efectivo sin identificación de parámetros en línea explícita, se construye una representación de estado de corriente dual informada por la física a partir de respuestas de corriente medibles, combinando una corriente de fase cero con la respuesta de corriente bajo el comando de fase aplicado. El agente se entrena utilizando una recompensa definida directamente a partir de la potencia de carga normalizada, y las fases de voltaje del transmisor sirven como acciones de control. En simulaciones de un sistema de cinco transmisores, la política aprendida logra aproximadamente el 97% de la potencia máxima teórica en la región de entrenamiento y alrededor del 96% en la región de evaluación ampliada. Estudios adicionales de robustez muestran un rendimiento sólido bajo ruido de medición moderado y una recuperación sustancial bajo desajuste del modelo después de un breve ajuste fino. La validación experimental en un prototipo físico confirma la efectividad del método, logrando una mejora promedio de potencia del 188% desde una línea base de fase cero y alcanzando el 87% de la potencia máxima medida en la plataforma de hardware. Estos resultados apoyan el método propuesto como una alternativa práctica basada en datos para la optimización de potencia MTSR-WPT dependiente del modelo para la carga inalámbrica de UAV.