Búsqueda y Rescate en Tiempo Real con Drones: Un Enfoque de Aprendizaje Profundo para la Detección de Objetos Pequeños Basado en YOLO
Autores: Ciccone, Francesco; Ceruti, Alessandro
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Búsqueda y Rescate en Tiempo Real con Drones: Un Enfoque de Aprendizaje Profundo para la Detección de Objetos Pequeños Basado en YOLO
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículos aéreos no tripulados
Búsqueda y rescate
Modelos de detección de objetos
Escenarios en tiempo real
Aprendizaje por transferencia
Eficiencia computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los vehículos aéreos no tripulados se utilizan cada vez más en operaciones civiles de búsqueda y rescate debido a su rápida implementación y capacidades de cobertura de áreas amplias. Sin embargo, detectar personas desaparecidas a partir de imágenes aéreas sigue siendo un desafío debido al pequeño tamaño de los objetos, fondos desordenados y recursos computacionales limitados a bordo, especialmente cuando son gestionados por agencias civiles. En este trabajo, presentamos una metodología integral para optimizar modelos de detección de objetos basados en YOLO para escenarios de búsqueda y rescate en tiempo real. Se empleó una estrategia de transferencia de aprendizaje en dos etapas utilizando VisDrone para la detección general de objetos aéreos y Heridal para el ajuste fino específico de búsqueda y rescate. Exploramos varias modificaciones arquitectónicas, incluyendo fusión de características mejorada (FPN, BiFPN, PB-FPN), cabezales de detección adicionales (P2) y módulos como CBAM, Transformers y deconvolución, analizando su impacto en el rendimiento y la eficiencia computacional. La configuración con mejor rendimiento (YOLOv5s-PBfpn-Deconv) logró un mAP@50 de 0.802 en el conjunto de datos de Heridal mientras mantenía inferencia en tiempo real en hardware embebido (Jetson Nano). Pruebas adicionales a diferentes altitudes de vuelo y análisis de explicabilidad utilizando EigenCAM confirmaron la robustez e interpretabilidad del modelo en condiciones del mundo real. La solución propuesta ofrece un marco viable para implementar sistemas de IA ligeros e interpretables para operaciones de búsqueda y rescate basadas en UAV gestionadas por autoridades de protección civil. Las limitaciones y direcciones futuras incluyen la integración de sensores multimodales y la adaptación a condiciones ambientales más amplias.
Descripción
Los vehículos aéreos no tripulados se utilizan cada vez más en operaciones civiles de búsqueda y rescate debido a su rápida implementación y capacidades de cobertura de áreas amplias. Sin embargo, detectar personas desaparecidas a partir de imágenes aéreas sigue siendo un desafío debido al pequeño tamaño de los objetos, fondos desordenados y recursos computacionales limitados a bordo, especialmente cuando son gestionados por agencias civiles. En este trabajo, presentamos una metodología integral para optimizar modelos de detección de objetos basados en YOLO para escenarios de búsqueda y rescate en tiempo real. Se empleó una estrategia de transferencia de aprendizaje en dos etapas utilizando VisDrone para la detección general de objetos aéreos y Heridal para el ajuste fino específico de búsqueda y rescate. Exploramos varias modificaciones arquitectónicas, incluyendo fusión de características mejorada (FPN, BiFPN, PB-FPN), cabezales de detección adicionales (P2) y módulos como CBAM, Transformers y deconvolución, analizando su impacto en el rendimiento y la eficiencia computacional. La configuración con mejor rendimiento (YOLOv5s-PBfpn-Deconv) logró un mAP@50 de 0.802 en el conjunto de datos de Heridal mientras mantenía inferencia en tiempo real en hardware embebido (Jetson Nano). Pruebas adicionales a diferentes altitudes de vuelo y análisis de explicabilidad utilizando EigenCAM confirmaron la robustez e interpretabilidad del modelo en condiciones del mundo real. La solución propuesta ofrece un marco viable para implementar sistemas de IA ligeros e interpretables para operaciones de búsqueda y rescate basadas en UAV gestionadas por autoridades de protección civil. Las limitaciones y direcciones futuras incluyen la integración de sensores multimodales y la adaptación a condiciones ambientales más amplias.