logo móvil
Contáctanos

Cálculo de Comandos de Control de Incendios Basado en Aprendizaje por Refuerzo Inverso de un Helicóptero Autónomo No Tripulado Utilizando Demostración de Inteligencia de Enjambre

Autores: Zhu, Haojie; Chen, Mou; Han, Zengliang; Lungu, Mihai

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Cálculo de Comandos de Control de Incendios Basado en Aprendizaje por Refuerzo Inverso de un Helicóptero Autónomo No Tripulado Utilizando Demostración de Inteligencia de Enjambre


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Cálculo de comando de control de fuego
Helicóptero autónomo no tripulado
Aprendizaje por refuerzo inverso
Perturbación del viento
Demostración de inteligencia de enjambre
Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones


Descripción
Este documento se refiere al cálculo del comando de control de fuego (FCCC) de un helicóptero autónomo no tripulado (UAH). Determina el efecto final del ataque del UAH. Aunque se han propuesto muchos métodos diferentes de FCCC para encontrar procesos de ejecución de control de fuego óptimos o casi óptimos, la mayoría son lentos en velocidad de cálculo o bajos en precisión de ataque. Este documento propone un nuevo método de FCCC basado en el aprendizaje por refuerzo inverso (IRL) para calcular los comandos de control de fuego en tiempo real sin perder precisión al considerar la perturbación del viento. Primero, se propone un método de determinación balística basado en un algoritmo iterativo de velocidad adaptativa de Verlet para el cálculo del punto de impacto del proyectil no guiado bajo perturbación del viento. Además, se propone un modelo de demostración de inteligencia de enjambre (SID) para demostrar la enseñanza; este modelo se basa en un algoritmo mejorado de optimización por enjambre de partículas (IPSO). Gracias a la capacidad de optimización global del algoritmo IPSO, el modelo SID a menudo conduce a una solución exacta. Además, se entrena una red neuronal de función de recompensa (RFNN) de acuerdo con el modelo SID, y se utiliza un modelo de aprendizaje por refuerzo (RL) que emplea RFNN para generar los comandos de control de fuego en tiempo real. Finalmente, los resultados de la simulación verifican la viabilidad y efectividad del método FCCC propuesto.

Otros recursos que podrían interesarte

Temas Virtualpro