Un Método Novel para un Juego de Persecución-Evasión Basado en Aprendizaje Q Difuso y Control Predictivo por Modelo
Autores: Hu, Penglin; Zhao, Chunhui; Pan, Quan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un Método Novel para un Juego de Persecución-Evasión Basado en Aprendizaje Q Difuso y Control Predictivo por Modelo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Exploración
Juego de persecución y evasión
Quadrotors
Aprendizaje Q difuso
Control predictivo basado en modelo
Simulación.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento explora un juego de persecución y evasión (PEG) basado en quadrotors al combinar algoritmos de aprendizaje Q difuso (FQL) y control predictivo basado en modelo (MPC). Inicialmente, se emplea el algoritmo FQL para percibir, tomar decisiones y predecir la trayectoria del evadido. Basándose en la información de posición y velocidad de ambos jugadores en el juego, el quadrotor perseguidor determina su estrategia de acción utilizando el algoritmo FQL. Posteriormente, se diseña un controlador de retroalimentación de estado utilizando el algoritmo MPC, con entradas de referencia derivadas del algoritmo FQL. Dentro de cada ciclo de MPC, el algoritmo FQL proporciona dinámicamente entradas de referencia al MPC, mejorando así su control robusto y optimización dinámica para el quadrotor. Finalmente, los resultados de la simulación verifican la efectividad del algoritmo propuesto.
Descripción
Este documento explora un juego de persecución y evasión (PEG) basado en quadrotors al combinar algoritmos de aprendizaje Q difuso (FQL) y control predictivo basado en modelo (MPC). Inicialmente, se emplea el algoritmo FQL para percibir, tomar decisiones y predecir la trayectoria del evadido. Basándose en la información de posición y velocidad de ambos jugadores en el juego, el quadrotor perseguidor determina su estrategia de acción utilizando el algoritmo FQL. Posteriormente, se diseña un controlador de retroalimentación de estado utilizando el algoritmo MPC, con entradas de referencia derivadas del algoritmo FQL. Dentro de cada ciclo de MPC, el algoritmo FQL proporciona dinámicamente entradas de referencia al MPC, mejorando así su control robusto y optimización dinámica para el quadrotor. Finalmente, los resultados de la simulación verifican la efectividad del algoritmo propuesto.