Modelo de Aprendizaje Profundo Jerárquico para Identificar Objetivos Similares en Imágenes de UAV
Autores: Borovyk, Dmytro; Barmak, Oleksander; Radiuk, Pavlo; Krak, Iurii
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Modelo de Aprendizaje Profundo Jerárquico para Identificar Objetivos Similares en Imágenes de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Aprendizaje profundo
Arquitectura jerárquica
Imágenes de UAV
Clasificación multinivel
Clasificación de alta precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección precisa de objetos en imágenes de UAV es crítica para la conciencia situacional, sin embargo, los modelos convencionales de aprendizaje profundo a menudo tienen dificultades para distinguir entre objetivos visualmente similares. Para abordar este desafío, este estudio introduce una arquitectura de aprendizaje profundo jerárquica que descompone la tarea de detección multi-clase en una cascada de clasificación estructurada y multinivel. Nuestro enfoque combina un Faster R-CNN de alto recall para la propuesta inicial de objetos, modelos YOLO especializados para la extracción de características granulares y un FT-Transformer dedicado para la clasificación de alta precisión. La evaluación experimental en un conjunto de datos complejo demostró la efectividad de esta estrategia. El modelo jerárquico logró un F1-score agregado del 93.9%, lo que representa una mejora del 1.41% sobre el F1-score del 92.46% de un modelo base tradicional no jerárquico. Estos resultados indican que una cascada modular de grueso a fino puede reducir efectivamente la ambigüedad entre clases, ofreciendo un enfoque escalable para mejorar el reconocimiento de objetos en entornos complejos de monitoreo basado en UAV. Este trabajo contribuye con un enfoque prometedor para desarrollar sistemas de conciencia situacional más precisos y confiables.
Descripción
La detección precisa de objetos en imágenes de UAV es crítica para la conciencia situacional, sin embargo, los modelos convencionales de aprendizaje profundo a menudo tienen dificultades para distinguir entre objetivos visualmente similares. Para abordar este desafío, este estudio introduce una arquitectura de aprendizaje profundo jerárquica que descompone la tarea de detección multi-clase en una cascada de clasificación estructurada y multinivel. Nuestro enfoque combina un Faster R-CNN de alto recall para la propuesta inicial de objetos, modelos YOLO especializados para la extracción de características granulares y un FT-Transformer dedicado para la clasificación de alta precisión. La evaluación experimental en un conjunto de datos complejo demostró la efectividad de esta estrategia. El modelo jerárquico logró un F1-score agregado del 93.9%, lo que representa una mejora del 1.41% sobre el F1-score del 92.46% de un modelo base tradicional no jerárquico. Estos resultados indican que una cascada modular de grueso a fino puede reducir efectivamente la ambigüedad entre clases, ofreciendo un enfoque escalable para mejorar el reconocimiento de objetos en entornos complejos de monitoreo basado en UAV. Este trabajo contribuye con un enfoque prometedor para desarrollar sistemas de conciencia situacional más precisos y confiables.