logo móvil
Contáctanos

Aprendizaje por refuerzo jerárquico consciente de la energía basado en el algoritmo de consumo energético predictivo para robots aéreos de búsqueda y rescate en entornos desconocidos

Autores: Ramezani, M.; Amiri Atashgah, M. A.

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Aprendizaje por refuerzo jerárquico consciente de la energía basado en el algoritmo de consumo energético predictivo para robots aéreos de búsqueda y rescate en entornos desconocidos


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Robots aéreo
Misiones de búsqueda y rescate
áreas afectadas por desastres
Duración de la batería
Aprendizaje por refuerzo
Modelo LSTM

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los robots aéreos (drones) ofrecen ventajas críticas en misiones donde la participación humana se ve impedida debido a condiciones peligrosas. Entre estas, las misiones de búsqueda y rescate en áreas afectadas por desastres son particularmente desafiantes debido a la naturaleza dinámica e impredecible del entorno, a menudo agravada por la falta de modelos ambientales confiables y la comunicación limitada con el sistema terrestre. En tales escenarios, la operación de robots aéreos autónomos se vuelve esencial. Este documento presenta un nuevo algoritmo basado en aprendizaje por refuerzo jerárquico para abordar la limitación crítica de la vida útil de la batería del robot aéreo. Central a nuestro enfoque está la integración de un modelo de memoria a corto y largo plazo (LSTM), diseñado para la predicción precisa del consumo de batería. Este modelo se incorpora en nuestro marco de HRL, empoderando a un controlador de alto nivel para establecer metas factibles y energéticamente eficientes para un controlador de bajo nivel. Al optimizar el uso de la batería, nuestro algoritmo mejora la capacidad del robot aéreo para entregar paquetes de rescate a múltiples sobrevivientes sin la necesidad frecuente de recarga. Además, aumentamos nuestro enfoque de HRL con la repetición de experiencias retrospectivas a bajo nivel para mejorar su eficiencia de muestra.

Otros recursos que podrían interesarte

Temas Virtualpro