Hacia una Detección de Objetos Eficiente en Imágenes Aéreas de UAV a Gran Escala a través de Clasificación Multi-Tarea
Autores: Zhuang, Shuo; Hou, Yongxing; Wang, Di
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Hacia una Detección de Objetos Eficiente en Imágenes Aéreas de UAV a Gran Escala a través de Clasificación Multi-Tarea
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Imágenes de UAV a gran escala
Clasificación de múltiples tareas
Eficiencia de detección
Red de clasificación
Velocidad de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Lograr una detección de objetos rápida y efectiva en imágenes de vehículos aéreos no tripulados (VANT) a gran escala presenta un desafío. Los métodos existentes suelen dividir la imagen original grande del VANT en parches superpuestos y realizar la detección de objetos en cada parche de imagen. Sin embargo, las extensas áreas de fondo sin objetos en la imaginería aérea a gran escala reducen la eficiencia de detección. Para abordar este problema, proponemos un enfoque eficiente de detección de objetos para la imaginería aérea de VANT a gran escala a través de la clasificación de múltiples tareas. Específicamente, desarrollamos una red de clasificación de múltiples tareas (MTC) ligera para identificar eficientemente las áreas de fondo. Nuestro método aprovecha la información de etiquetas de cuadros delimitadores para construir una rama de generación de regiones salientes. Luego, para mejorar el proceso de entrenamiento de la red de clasificación, diseñamos una función de pérdida de múltiples tareas para optimizar los parámetros de la red de múltiples ramas. Además, introducimos una estrategia de umbral de clasificación óptima para equilibrar la velocidad y la precisión de detección. Nuestra red MTC propuesta puede determinar rápida y precisamente si un parche de imagen aérea contiene objetos, y puede integrarse sin problemas con detectores existentes sin necesidad de reentrenamiento. Realizamos experimentos en tres conjuntos de datos para verificar la efectividad y eficiencia de nuestro método de detección impulsado por clasificación, incluidos los conjuntos de datos DOTA v1.0, DOTA v2.0 y ASDD. En las imágenes de VANT a gran escala y el conjunto de datos ASDD, nuestro método propuesto aumenta la velocidad de detección en más del 30% y 130%, respectivamente, mientras mantiene un buen rendimiento en la detección de objetos.
Descripción
Lograr una detección de objetos rápida y efectiva en imágenes de vehículos aéreos no tripulados (VANT) a gran escala presenta un desafío. Los métodos existentes suelen dividir la imagen original grande del VANT en parches superpuestos y realizar la detección de objetos en cada parche de imagen. Sin embargo, las extensas áreas de fondo sin objetos en la imaginería aérea a gran escala reducen la eficiencia de detección. Para abordar este problema, proponemos un enfoque eficiente de detección de objetos para la imaginería aérea de VANT a gran escala a través de la clasificación de múltiples tareas. Específicamente, desarrollamos una red de clasificación de múltiples tareas (MTC) ligera para identificar eficientemente las áreas de fondo. Nuestro método aprovecha la información de etiquetas de cuadros delimitadores para construir una rama de generación de regiones salientes. Luego, para mejorar el proceso de entrenamiento de la red de clasificación, diseñamos una función de pérdida de múltiples tareas para optimizar los parámetros de la red de múltiples ramas. Además, introducimos una estrategia de umbral de clasificación óptima para equilibrar la velocidad y la precisión de detección. Nuestra red MTC propuesta puede determinar rápida y precisamente si un parche de imagen aérea contiene objetos, y puede integrarse sin problemas con detectores existentes sin necesidad de reentrenamiento. Realizamos experimentos en tres conjuntos de datos para verificar la efectividad y eficiencia de nuestro método de detección impulsado por clasificación, incluidos los conjuntos de datos DOTA v1.0, DOTA v2.0 y ASDD. En las imágenes de VANT a gran escala y el conjunto de datos ASDD, nuestro método propuesto aumenta la velocidad de detección en más del 30% y 130%, respectivamente, mientras mantiene un buen rendimiento en la detección de objetos.