Aprendizaje reforzado basado en asignación de recursos para múltiples vehículos con mecanismo de detección asistida por comunicación
Autores: Fan, Yuxin; Fei, Zesong; Huang, Jingxuan; Wang, Xinyi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aprendizaje reforzado basado en asignación de recursos para múltiples vehículos con mecanismo de detección asistida por comunicación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Vehículos autónomos
Sensores integrados
Comunicaciones
TD-ISAC
Sensores colaborativos de múltiples vehículos
Aprendizaje profundo por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Los vehículos autónomos (AVs) pueden estar equipados con dispositivos de Sensado y Comunicaciones Integradas (ISAC) para realizar funciones de sensado y comunicación simultáneamente. El ISAC de división de tiempo (TD-ISAC) es ventajoso debido a su facilidad de implementación, despliegue eficiente e integración en cualquier sistema. TD-ISAC mejora significativamente la eficiencia del espectro y la utilización del equipo, y reduce el consumo de energía del sistema. En este documento, proponemos un mecanismo de sensado asistido por comunicación basado en TD-ISAC para apoyar el sensado colaborativo de múltiples vehículos. Sin embargo, existen algunos desafíos en la aplicación de TD-ISAC a los AVs. En primer lugar, los AVs deben asignar recursos para el sensado y la comunicación en un entorno que cambia dinámicamente. En segundo lugar, los recursos de espectro limitado plantean el problema de la interferencia mutua de las señales de múltiples vehículos. Para abordar estos problemas, construimos un modelo de interferencia de señal de múltiples vehículos, formulamos un problema de optimización basado en el marco de proceso de decisión de Markov parcialmente observable (POMDP) y diseñamos un esquema de asignación dinámica descentralizada para los recursos de tiempo-frecuencia de múltiples vehículos basado en un algoritmo de aprendizaje profundo por refuerzo (DRL). Los resultados de la simulación muestran que el esquema propuesto funciona mejor en términos de probabilidad de detección errónea y potencia de interferencia promedio del sistema en comparación con el algoritmo DRQN sin el mecanismo de sensado asistido por comunicación y el algoritmo aleatorio sin aprendizaje por refuerzo. Podemos concluir que el esquema propuesto puede asignar efectivamente los recursos del sistema TD-ISAC y reducir la interferencia entre múltiples vehículos.
Descripción
Los vehículos autónomos (AVs) pueden estar equipados con dispositivos de Sensado y Comunicaciones Integradas (ISAC) para realizar funciones de sensado y comunicación simultáneamente. El ISAC de división de tiempo (TD-ISAC) es ventajoso debido a su facilidad de implementación, despliegue eficiente e integración en cualquier sistema. TD-ISAC mejora significativamente la eficiencia del espectro y la utilización del equipo, y reduce el consumo de energía del sistema. En este documento, proponemos un mecanismo de sensado asistido por comunicación basado en TD-ISAC para apoyar el sensado colaborativo de múltiples vehículos. Sin embargo, existen algunos desafíos en la aplicación de TD-ISAC a los AVs. En primer lugar, los AVs deben asignar recursos para el sensado y la comunicación en un entorno que cambia dinámicamente. En segundo lugar, los recursos de espectro limitado plantean el problema de la interferencia mutua de las señales de múltiples vehículos. Para abordar estos problemas, construimos un modelo de interferencia de señal de múltiples vehículos, formulamos un problema de optimización basado en el marco de proceso de decisión de Markov parcialmente observable (POMDP) y diseñamos un esquema de asignación dinámica descentralizada para los recursos de tiempo-frecuencia de múltiples vehículos basado en un algoritmo de aprendizaje profundo por refuerzo (DRL). Los resultados de la simulación muestran que el esquema propuesto funciona mejor en términos de probabilidad de detección errónea y potencia de interferencia promedio del sistema en comparación con el algoritmo DRQN sin el mecanismo de sensado asistido por comunicación y el algoritmo aleatorio sin aprendizaje por refuerzo. Podemos concluir que el esquema propuesto puede asignar efectivamente los recursos del sistema TD-ISAC y reducir la interferencia entre múltiples vehículos.