Aprendizaje por Refuerzo Profundo para la Entrega con Drones
Autores: Muñoz, Guillem; Barrado, Cristina; Çetin, Ender; Salami, Esther
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Aprendizaje por Refuerzo Profundo para la Entrega con Drones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones
Obstáculos
Inteligencia artificial
Aprendizaje por refuerzo
Sensores
Puntos de control
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Se espera que los drones se utilicen ampliamente para tareas de entrega en el futuro. En ausencia de obstáculos, la navegación basada en satélites desde el punto de partida hasta el destino geolocalizado es una tarea sencilla. Cuando se conocen obstáculos en el camino, los pilotos deben elaborar un plan de vuelo para evitarlos. Sin embargo, cuando son desconocidos, hay demasiados o están en lugares que no son posiciones fijas, entonces construir un plan de vuelo seguro se vuelve muy desafiante. Además, en un entorno con señal de satélite débil, como en interiores, bajo la copa de los árboles o en cañones urbanos, los sistemas de navegación de drones actuales pueden fallar. La inteligencia artificial, un área de investigación con actividad creciente, puede utilizarse para superar tales desafíos. Inicialmente enfocada en robots y ahora aplicada principalmente a vehículos terrestres, la inteligencia artificial comienza a utilizarse también para entrenar drones. El aprendizaje por refuerzo es la rama de la inteligencia artificial capaz de entrenar máquinas. La aplicación del aprendizaje por refuerzo a los drones les proporcionará más inteligencia, convirtiendo eventualmente a los drones en máquinas completamente autónomas. En este trabajo, se estudia el aprendizaje por refuerzo para la entrega con drones. Como sensores, el dron solo tiene una cámara frontal de visión estereoscópica, de la cual se obtiene información de profundidad. El dron es entrenado para volar hacia un destino en un entorno vecinal que tiene muchos obstáculos como árboles, cables, coches y casas. El área de vuelo también está delimitada por una geo-valla; esta es una valla virtual (no visible) que impide que el dron entre o salga de un área definida. El dron debe evitar obstáculos visibles y debe alcanzar un objetivo. Los resultados muestran que, en comparación con los resultados anteriores, los nuevos algoritmos tienen mejores resultados, no solo con una mejor recompensa, sino también con una reducción de su varianza. La segunda contribución son los puntos de control. Consisten en guardar un modelo entrenado cada vez que se logra una mejor recompensa. Los resultados muestran cómo los puntos de control mejoran los resultados de las pruebas.
Descripción
Se espera que los drones se utilicen ampliamente para tareas de entrega en el futuro. En ausencia de obstáculos, la navegación basada en satélites desde el punto de partida hasta el destino geolocalizado es una tarea sencilla. Cuando se conocen obstáculos en el camino, los pilotos deben elaborar un plan de vuelo para evitarlos. Sin embargo, cuando son desconocidos, hay demasiados o están en lugares que no son posiciones fijas, entonces construir un plan de vuelo seguro se vuelve muy desafiante. Además, en un entorno con señal de satélite débil, como en interiores, bajo la copa de los árboles o en cañones urbanos, los sistemas de navegación de drones actuales pueden fallar. La inteligencia artificial, un área de investigación con actividad creciente, puede utilizarse para superar tales desafíos. Inicialmente enfocada en robots y ahora aplicada principalmente a vehículos terrestres, la inteligencia artificial comienza a utilizarse también para entrenar drones. El aprendizaje por refuerzo es la rama de la inteligencia artificial capaz de entrenar máquinas. La aplicación del aprendizaje por refuerzo a los drones les proporcionará más inteligencia, convirtiendo eventualmente a los drones en máquinas completamente autónomas. En este trabajo, se estudia el aprendizaje por refuerzo para la entrega con drones. Como sensores, el dron solo tiene una cámara frontal de visión estereoscópica, de la cual se obtiene información de profundidad. El dron es entrenado para volar hacia un destino en un entorno vecinal que tiene muchos obstáculos como árboles, cables, coches y casas. El área de vuelo también está delimitada por una geo-valla; esta es una valla virtual (no visible) que impide que el dron entre o salga de un área definida. El dron debe evitar obstáculos visibles y debe alcanzar un objetivo. Los resultados muestran que, en comparación con los resultados anteriores, los nuevos algoritmos tienen mejores resultados, no solo con una mejor recompensa, sino también con una reducción de su varianza. La segunda contribución son los puntos de control. Consisten en guardar un modelo entrenado cada vez que se logra una mejor recompensa. Los resultados muestran cómo los puntos de control mejoran los resultados de las pruebas.