logo móvil
Contáctanos

De Equipos Humanos a Enjambres Autónomos: Un Marco de Evaluación Basado en Aprendizaje por Refuerzo para Misiones de Búsqueda y Rescate con Vehículos Aéreos No Tripulados

Autores: Bialas, Julian; Mohebbi, Mohammad Reza; van Veelen, Michiel J.; Mejia-Aguilar, Abraham; Kathrein, Robert; Döller, Mario

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

De Equipos Humanos a Enjambres Autónomos: Un Marco de Evaluación Basado en Aprendizaje por Refuerzo para Misiones de Búsqueda y Rescate con Vehículos Aéreos No Tripulados


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Tecnologías
Vehículos aéreos no tripulados
Operaciones de búsqueda y rescate
Configuraciones autónomas
Marco de referencia de evaluación
Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La adopción de tecnologías novedosas como los Vehículos Aéreos No Tripulados (VANT) en operaciones de Búsqueda y Rescate (SAR) sigue siendo limitada. Como resultado, su potencial completo aún no se ha realizado. Aunque los VANT se han desplegado de manera ad hoc, típicamente bajo control manual por operadores dedicados, las configuraciones asistidas y completamente autónomas siguen siendo en gran medida inexploradas. En este estudio, se evalúan sistemáticamente tres marcos de SAR dentro de un marco de referencia unificado: misiones terrestres convencionales, misiones asistidas por VANT y operaciones de VANT completamente autónomas. Como indicador clave de rendimiento, se cuantificó el tiempo de localización del objetivo y se utilizó como medio de comparación entre los marcos. Los marcos convencional y asistido fueron probados experimentalmente a través de hardware físico en un entorno exterior controlado, donde se produjeron simulaciones de llamadas a través de equipos de rescate. El marco de enjambre autónomo fue simulado en forma de un método de Aprendizaje por Refuerzo (RL) multiagente mediante el uso del algoritmo de Optimización de Políticas Proximales (PPO). Esto permitió la optimización de las acciones cooperativas descentralizadas que podrían ocurrir para una exploración eficiente de un entorno tridimensional parcialmente observado. Nuestros resultados demostraron que el enjambre autónomo superó significativamente a los enfoques convencional y asistido en términos de velocidad y cobertura. Finalmente, se proporciona una representación detallada de la integración del marco en un sistema operativo.

Otros recursos que podrían interesarte

Temas Virtualpro