Control óptimo de consenso basado en juegos de suma cero y eventos desencadenados por tiempo fijo de sistemas multiagente bajo ataques de FDI
Autores: Yang, Jing; Li, Ruihong; Gan, Qintao; Huang, Xinxin
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Control óptimo de consenso basado en juegos de suma cero y eventos desencadenados por tiempo fijo de sistemas multiagente bajo ataques de FDI
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Consenso
Ataques de IDE
Protocolo de control seguro
Ecuación de Hamilton-Jacobi-Isaacs
Mecanismo desencadenado por eventos
Aprendizaje por refuerzo en línea
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Este documento se centra en el problema de consenso óptimo de tiempo fijo de sistemas de múltiples agentes (MASs) bajo ataques de inyección de datos falsos (FDI). Para mitigar los ataques de FDI en sensores y actuadores que pueden hacer que los sistemas se desvíen de la trayectoria de referencia, se establece un marco de juego de suma cero, donde el protocolo de control seguro apunta a un mejor rendimiento del sistema, aunque el atacante juega un papel contrario. Al resolver la ecuación Hamilton-Jacobi-Isaacs (HJI) relacionada con el juego de suma cero, se obtiene un controlador óptimo de seguimiento seguro basado en el mecanismo de disparo de eventos (ETM) para disminuir el consumo de recursos del sistema mientras se garantiza el consenso de tiempo fijo. Además, se propone un algoritmo de aprendizaje por refuerzo (RL) en línea solo para críticos para aproximar la política óptima, en el que las redes neuronales críticas se construyen mediante un enfoque basado en la repetición de experiencias. Se adoptan sistemas de vehículos aéreos no tripulados (UAV) para verificar la viabilidad del enfoque presentado.
Descripción
Este documento se centra en el problema de consenso óptimo de tiempo fijo de sistemas de múltiples agentes (MASs) bajo ataques de inyección de datos falsos (FDI). Para mitigar los ataques de FDI en sensores y actuadores que pueden hacer que los sistemas se desvíen de la trayectoria de referencia, se establece un marco de juego de suma cero, donde el protocolo de control seguro apunta a un mejor rendimiento del sistema, aunque el atacante juega un papel contrario. Al resolver la ecuación Hamilton-Jacobi-Isaacs (HJI) relacionada con el juego de suma cero, se obtiene un controlador óptimo de seguimiento seguro basado en el mecanismo de disparo de eventos (ETM) para disminuir el consumo de recursos del sistema mientras se garantiza el consenso de tiempo fijo. Además, se propone un algoritmo de aprendizaje por refuerzo (RL) en línea solo para críticos para aproximar la política óptima, en el que las redes neuronales críticas se construyen mediante un enfoque basado en la repetición de experiencias. Se adoptan sistemas de vehículos aéreos no tripulados (UAV) para verificar la viabilidad del enfoque presentado.