logo móvil
Contáctanos

Aprendizaje reforzado basado en asignación de recursos para múltiples vehículos con mecanismo de detección asistida por comunicación

Autores: Fan, Yuxin; Fei, Zesong; Huang, Jingxuan; Wang, Xinyi

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Aprendizaje reforzado basado en asignación de recursos para múltiples vehículos con mecanismo de detección asistida por comunicación


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Vehículos autónomos
Sensores integrados
Comunicaciones
TD-ISAC
Sensores colaborativos de múltiples vehículos
Aprendizaje profundo por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones


Descripción
Los vehículos autónomos (AVs) pueden estar equipados con dispositivos de Sensado y Comunicaciones Integradas (ISAC) para realizar funciones de sensado y comunicación simultáneamente. El ISAC de división de tiempo (TD-ISAC) es ventajoso debido a su facilidad de implementación, despliegue eficiente e integración en cualquier sistema. TD-ISAC mejora significativamente la eficiencia del espectro y la utilización del equipo, y reduce el consumo de energía del sistema. En este documento, proponemos un mecanismo de sensado asistido por comunicación basado en TD-ISAC para apoyar el sensado colaborativo de múltiples vehículos. Sin embargo, existen algunos desafíos en la aplicación de TD-ISAC a los AVs. En primer lugar, los AVs deben asignar recursos para el sensado y la comunicación en un entorno que cambia dinámicamente. En segundo lugar, los recursos de espectro limitado plantean el problema de la interferencia mutua de las señales de múltiples vehículos. Para abordar estos problemas, construimos un modelo de interferencia de señal de múltiples vehículos, formulamos un problema de optimización basado en el marco de proceso de decisión de Markov parcialmente observable (POMDP) y diseñamos un esquema de asignación dinámica descentralizada para los recursos de tiempo-frecuencia de múltiples vehículos basado en un algoritmo de aprendizaje profundo por refuerzo (DRL). Los resultados de la simulación muestran que el esquema propuesto funciona mejor en términos de probabilidad de detección errónea y potencia de interferencia promedio del sistema en comparación con el algoritmo DRQN sin el mecanismo de sensado asistido por comunicación y el algoritmo aleatorio sin aprendizaje por refuerzo. Podemos concluir que el esquema propuesto puede asignar efectivamente los recursos del sistema TD-ISAC y reducir la interferencia entre múltiples vehículos.

Otros recursos que podrían interesarte

Temas Virtualpro