Maca: multi-agente con asignación de crédito para la descarga de cálculos en la monitorización de parques inteligentes
Autores: She, Liang; Wang, Jianyuan; Bo, Yifan; Zeng, Yangyan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Maca: multi-agente con asignación de crédito para la descarga de cálculos en la monitorización de parques inteligentes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Monitoreo de video
Eficiencia
Procesamiento de datos
Descarga de cálculos
Aprendizaje profundo por refuerzo
Parque inteligente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
La monitorización de video tiene una amplia gama de aplicaciones en una variedad de escenarios, especialmente en parques inteligentes. Cómo mejorar la eficiencia del procesamiento de datos de video y reducir el consumo de recursos se ha convertido en una preocupación creciente. La alta complejidad de los algoritmos tradicionales de descarga de cálculos dificulta su aplicación en escenarios de toma de decisiones en tiempo real. Por lo tanto, proponemos un algoritmo de aprendizaje profundo de refuerzo multiagente con asignación de crédito (MACA) para la descarga de cálculos en la monitorización de parques inteligentes. Al tomar decisiones en línea después de un entrenamiento fuera de línea, el agente puede considerar tanto el tiempo de decisión como la precisión para resolver efectivamente el problema de la maldición de la dimensionalidad. A través de simulaciones, comparamos el rendimiento de MACA con el algoritmo tradicional de aprendizaje profundo de refuerzo de red Q y otros métodos. Nuestros resultados muestran que MACA funciona mejor en escenarios con un mayor número de agentes y puede minimizar la demora de solicitud y reducir el consumo de energía de la tarea. Además, también proporcionamos resultados de una experimentación verificada de capacidad de generalización y un estudio de ablación, que demuestran la contribución del algoritmo MACA a cada componente.
Descripción
La monitorización de video tiene una amplia gama de aplicaciones en una variedad de escenarios, especialmente en parques inteligentes. Cómo mejorar la eficiencia del procesamiento de datos de video y reducir el consumo de recursos se ha convertido en una preocupación creciente. La alta complejidad de los algoritmos tradicionales de descarga de cálculos dificulta su aplicación en escenarios de toma de decisiones en tiempo real. Por lo tanto, proponemos un algoritmo de aprendizaje profundo de refuerzo multiagente con asignación de crédito (MACA) para la descarga de cálculos en la monitorización de parques inteligentes. Al tomar decisiones en línea después de un entrenamiento fuera de línea, el agente puede considerar tanto el tiempo de decisión como la precisión para resolver efectivamente el problema de la maldición de la dimensionalidad. A través de simulaciones, comparamos el rendimiento de MACA con el algoritmo tradicional de aprendizaje profundo de refuerzo de red Q y otros métodos. Nuestros resultados muestran que MACA funciona mejor en escenarios con un mayor número de agentes y puede minimizar la demora de solicitud y reducir el consumo de energía de la tarea. Además, también proporcionamos resultados de una experimentación verificada de capacidad de generalización y un estudio de ablación, que demuestran la contribución del algoritmo MACA a cada componente.