Un método de planificación de comportamiento consciente de humanos en línea para sistemas de UAV no deterministas bajo verificación de modelos probabilísticos
Autores: Zhu, Jiancheng; Wang, Peng; Peng, Yong; Yin, Quanjun
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un método de planificación de comportamiento consciente de humanos en línea para sistemas de UAV no deterministas bajo verificación de modelos probabilísticos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Método propuesto
UAVs
Colaboradores humanos
Descripciones de tareas LTL
Planificación de comportamiento
Verificación de modelos probabilísticos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento propone un método de planificación de comportamiento consciente de humanos en línea para permitir que los Vehículos Aéreos No Tripulados (VANT) satisfagan dinámicamente las descripciones de tareas de lógica temporal lineal (LTL) de alto nivel de los colaboradores humanos. El método propuesto tiene el potencial de aplicarse a la colaboración industrial entre humanos y VANT. El proceso específico es el siguiente. En primer lugar, la tarea global de alto nivel del VANT se describe utilizando el lenguaje formal de LTL, que generalmente puede ser emitido por colaboradores humanos en lenguaje natural. En segundo lugar, la descripción de la tarea se transforma en un autómata de Rabin determinista, y luego los valores de estado del autómata se determinan por la distancia a los estados aceptados. En tercer lugar, se utiliza el proceso de decisión de Markov para construir el modelo de comportamiento probabilístico del VANT fuera de línea. Basado en este modelo, se construye dinámicamente en línea un autómata de estados finitos en el horizonte finito, y se construye el sistema de producto cartesiano dentro del horizonte, en el cual los estados de llegada esperados dentro del horizonte se establecen mediante los valores de estado mínimos. Finalmente, con el objetivo de maximizar la probabilidad de alcanzabilidad de los estados esperados, se introduce el algoritmo de iteración de valores para resolver el plan de comportamiento óptimo en línea dentro del horizonte finito. Después de esto, se forma un algoritmo de planificación y ejecución de horizonte infinito. Los experimentos y análisis muestran que los resultados de la planificación de comportamiento en línea son consistentes con la lógica de la tarea a nivel semántico, lo que indica la corrección del método propuesto. Además, el método propuesto puede aliviar eficazmente la explosión de estados causada por la verificación del modelo probabilístico global y mejorar la eficiencia de la generación de planes.
Descripción
Este documento propone un método de planificación de comportamiento consciente de humanos en línea para permitir que los Vehículos Aéreos No Tripulados (VANT) satisfagan dinámicamente las descripciones de tareas de lógica temporal lineal (LTL) de alto nivel de los colaboradores humanos. El método propuesto tiene el potencial de aplicarse a la colaboración industrial entre humanos y VANT. El proceso específico es el siguiente. En primer lugar, la tarea global de alto nivel del VANT se describe utilizando el lenguaje formal de LTL, que generalmente puede ser emitido por colaboradores humanos en lenguaje natural. En segundo lugar, la descripción de la tarea se transforma en un autómata de Rabin determinista, y luego los valores de estado del autómata se determinan por la distancia a los estados aceptados. En tercer lugar, se utiliza el proceso de decisión de Markov para construir el modelo de comportamiento probabilístico del VANT fuera de línea. Basado en este modelo, se construye dinámicamente en línea un autómata de estados finitos en el horizonte finito, y se construye el sistema de producto cartesiano dentro del horizonte, en el cual los estados de llegada esperados dentro del horizonte se establecen mediante los valores de estado mínimos. Finalmente, con el objetivo de maximizar la probabilidad de alcanzabilidad de los estados esperados, se introduce el algoritmo de iteración de valores para resolver el plan de comportamiento óptimo en línea dentro del horizonte finito. Después de esto, se forma un algoritmo de planificación y ejecución de horizonte infinito. Los experimentos y análisis muestran que los resultados de la planificación de comportamiento en línea son consistentes con la lógica de la tarea a nivel semántico, lo que indica la corrección del método propuesto. Además, el método propuesto puede aliviar eficazmente la explosión de estados causada por la verificación del modelo probabilístico global y mejorar la eficiencia de la generación de planes.