Resolución de Conflictos Distribuida en Altas Densidades de Tráfico con Aprendizaje por Refuerzo
Autores: Ribeiro, Marta; Ellerbroek, Joost; Hoekstra, Jacco
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Resolución de Conflictos Distribuida en Altas Densidades de Tráfico con Aprendizaje por Refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Operaciones
Drones
Densidades de tráfico
Resolución de conflictos
Aprendizaje por refuerzo
Aeronaves
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Se espera que las operaciones futuras que involucren drones resulten en densidades de tráfico que sean órdenes de magnitud más altas que cualquier observada en la aviación tripulada. Los métodos actuales de resolución de conflictos geométricos (CR) han demostrado ser muy eficientes a densidades relativamente moderadas. Sin embargo, a densidades más altas, el rendimiento se ve obstaculizado por el comportamiento emergente impredecible de las aeronaves vecinas. Las técnicas de aprendizaje por refuerzo (RL) son a menudo capaces de identificar patrones emergentes a través del entrenamiento en el entorno. Aunque algunos trabajos han comenzado a introducir RL para resolver conflictos y garantizar la separación entre aeronaves, no está claro cómo emplear estos métodos con un mayor número de aeronaves, y si estos pueden compararse o incluso superar el rendimiento de los métodos geométricos CR actuales. En este trabajo, empleamos un método de RL para la resolución distribuida de conflictos; el método es completamente responsable de garantizar la separación mínima de todas las aeronaves durante la operación. Se prueban dos formulaciones de acción diferentes: (1) donde el método de RL controla la dirección y la variación de velocidad; (2) donde el método de RL controla la dirección, la velocidad y la variación de altitud. Los valores finales de seguridad se comparan directamente con un algoritmo CR distribuido de última generación, el método de Potencial de Voltaje Modificado (MVP). Aunque, en general, el método de RL no es tan eficiente como MVP en la reducción del número total de pérdidas de separación mínima, sus acciones ayudan a identificar patrones favorables para evitar conflictos. El método de RL tiene un comportamiento más preventivo, defendiendo por adelantado contra aeronaves vecinas cercanas que aún no están en conflicto, y conflictos frontales mientras los intrusos aún están lejos.
Descripción
Se espera que las operaciones futuras que involucren drones resulten en densidades de tráfico que sean órdenes de magnitud más altas que cualquier observada en la aviación tripulada. Los métodos actuales de resolución de conflictos geométricos (CR) han demostrado ser muy eficientes a densidades relativamente moderadas. Sin embargo, a densidades más altas, el rendimiento se ve obstaculizado por el comportamiento emergente impredecible de las aeronaves vecinas. Las técnicas de aprendizaje por refuerzo (RL) son a menudo capaces de identificar patrones emergentes a través del entrenamiento en el entorno. Aunque algunos trabajos han comenzado a introducir RL para resolver conflictos y garantizar la separación entre aeronaves, no está claro cómo emplear estos métodos con un mayor número de aeronaves, y si estos pueden compararse o incluso superar el rendimiento de los métodos geométricos CR actuales. En este trabajo, empleamos un método de RL para la resolución distribuida de conflictos; el método es completamente responsable de garantizar la separación mínima de todas las aeronaves durante la operación. Se prueban dos formulaciones de acción diferentes: (1) donde el método de RL controla la dirección y la variación de velocidad; (2) donde el método de RL controla la dirección, la velocidad y la variación de altitud. Los valores finales de seguridad se comparan directamente con un algoritmo CR distribuido de última generación, el método de Potencial de Voltaje Modificado (MVP). Aunque, en general, el método de RL no es tan eficiente como MVP en la reducción del número total de pérdidas de separación mínima, sus acciones ayudan a identificar patrones favorables para evitar conflictos. El método de RL tiene un comportamiento más preventivo, defendiendo por adelantado contra aeronaves vecinas cercanas que aún no están en conflicto, y conflictos frontales mientras los intrusos aún están lejos.