Investigación sobre Métodos de Planificación de Rutas y Características de Vehículos Aéreos No Tripulados Urbanos Bajo Restricciones de Ruido
Autores: Chen, Yaqing; Jin, Yunfei; He, Xin; Zhang, Yumei
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Investigación sobre Métodos de Planificación de Rutas y Características de Vehículos Aéreos No Tripulados Urbanos Bajo Restricciones de Ruido
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Estudio
TNAP-DDQN
Aprendizaje profundo por refuerzo
Planificación de rutas de UAV
Restricciones de umbral de ruido
Restricciones operativas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio propone TNAP-DDQN, un método de aprendizaje por refuerzo profundo para la planificación de rutas de UAV a baja altitud en entornos urbanos bajo restricciones de umbral de ruido residencial. Con el costo de tiempo y el riesgo de seguridad como objetivos de optimización, se incorporan restricciones operativas como el riesgo de colisión y la altitud máxima AGL para lograr una optimización coordinada del cumplimiento del ruido, la seguridad operativa y la eficiencia. Para mitigar la contracción del espacio de acción y la inestabilidad del entrenamiento inducida por múltiples restricciones, se introduce una Red de Sesgo de Acción basada en Máscara de Degradación de Ruido (NDM-ABN) en la capa de selección de acciones. Un esquema de degradación de tres niveles previene conjuntos de candidatos vacíos, mientras que la toma de decisiones basada en sesgos se aplica a acciones aproximadamente empatadas para estabilizar la política. Además, la repetición de experiencia priorizada de múltiples pasos (PER) mejora la eficiencia de la muestra y el modelado de retornos a largo plazo, y la modelación de recompensas basada en potencial (PBRS) transforma señales de restricción escasas en recompensas auxiliares. Los resultados de la simulación indican que: (1) NDM-ABN es el módulo clave para estabilizar el proceso de exposición al ruido al suprimir acciones de alto ruido; (2) la AGL requerida está relacionada con el nivel de ruido de la fuente UAV y los límites de ruido locales, lo que implica la necesidad de clases de altitud AGL diferenciadas; y (3) el nivel máximo de ruido de fuente UAV admisible aumenta a medida que se relaja el umbral. El método propuesto proporciona orientación cuantitativa para la regulación de entrada de ruido y altitud AGL, mientras que el trabajo futuro incorporará métricas adicionales (por ejemplo, nivel de sonido equivalente ponderado A) para capturar mejor las fluctuaciones de ruido y los picos a corto plazo.
Descripción
Este estudio propone TNAP-DDQN, un método de aprendizaje por refuerzo profundo para la planificación de rutas de UAV a baja altitud en entornos urbanos bajo restricciones de umbral de ruido residencial. Con el costo de tiempo y el riesgo de seguridad como objetivos de optimización, se incorporan restricciones operativas como el riesgo de colisión y la altitud máxima AGL para lograr una optimización coordinada del cumplimiento del ruido, la seguridad operativa y la eficiencia. Para mitigar la contracción del espacio de acción y la inestabilidad del entrenamiento inducida por múltiples restricciones, se introduce una Red de Sesgo de Acción basada en Máscara de Degradación de Ruido (NDM-ABN) en la capa de selección de acciones. Un esquema de degradación de tres niveles previene conjuntos de candidatos vacíos, mientras que la toma de decisiones basada en sesgos se aplica a acciones aproximadamente empatadas para estabilizar la política. Además, la repetición de experiencia priorizada de múltiples pasos (PER) mejora la eficiencia de la muestra y el modelado de retornos a largo plazo, y la modelación de recompensas basada en potencial (PBRS) transforma señales de restricción escasas en recompensas auxiliares. Los resultados de la simulación indican que: (1) NDM-ABN es el módulo clave para estabilizar el proceso de exposición al ruido al suprimir acciones de alto ruido; (2) la AGL requerida está relacionada con el nivel de ruido de la fuente UAV y los límites de ruido locales, lo que implica la necesidad de clases de altitud AGL diferenciadas; y (3) el nivel máximo de ruido de fuente UAV admisible aumenta a medida que se relaja el umbral. El método propuesto proporciona orientación cuantitativa para la regulación de entrada de ruido y altitud AGL, mientras que el trabajo futuro incorporará métricas adicionales (por ejemplo, nivel de sonido equivalente ponderado A) para capturar mejor las fluctuaciones de ruido y los picos a corto plazo.