Detección de objetos multiescala a partir de imágenes de drones utilizando aprendizaje por transferencia en conjunto
Autores: Walambe, Rahee; Marathe, Aboli; Kotecha, Ketan
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de objetos multiescala a partir de imágenes de drones utilizando aprendizaje por transferencia en conjunto
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Vehículo aéreo no tripulado (VANT)
Imágenes
Visión por computadora
Aprendizaje por transferencia en conjunto
Imágenes de drones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos en imágenes de vehículos aéreos no tripulados (VANT) ha sido un desafío de larga data en el campo de la visión por computadora. Específicamente, la detección de objetos en imágenes de drones es una tarea compleja debido a los objetos de diversas escalas, como humanos, edificios, cuerpos de agua y colinas. En este artículo, presentamos una implementación de aprendizaje por transferencia en conjunto para mejorar el rendimiento de los modelos base para la detección de objetos multiescala en imágenes de drones. Combinado con una tubería de aumento en el tiempo de prueba, el algoritmo combina diferentes modelos y aplica estrategias de votación para detectar objetos de diversas escalas en imágenes de VANT. El aumento de datos también presenta una solución a la deficiencia de conjuntos de datos de imágenes de drones. Experimentamos con dos conjuntos de datos específicos en el dominio abierto: el conjunto de datos VisDrone y el conjunto de datos AU-AIR. Nuestro enfoque es más práctico y eficiente debido al uso de aprendizaje por transferencia y una estrategia de votación en conjunto de dos niveles en lugar de entrenar modelos personalizados en conjuntos de datos completos. La experimentación muestra una mejora significativa en el mAP para ambos conjuntos de datos, VisDrone y AU-AIR, al emplear el método de aprendizaje por transferencia en conjunto. Además, la utilización de estrategias de votación aumenta aún más la fiabilidad del conjunto, ya que el usuario final puede seleccionar y rastrear los efectos del mecanismo para las predicciones de cajas delimitadoras.
Descripción
La detección de objetos en imágenes de vehículos aéreos no tripulados (VANT) ha sido un desafío de larga data en el campo de la visión por computadora. Específicamente, la detección de objetos en imágenes de drones es una tarea compleja debido a los objetos de diversas escalas, como humanos, edificios, cuerpos de agua y colinas. En este artículo, presentamos una implementación de aprendizaje por transferencia en conjunto para mejorar el rendimiento de los modelos base para la detección de objetos multiescala en imágenes de drones. Combinado con una tubería de aumento en el tiempo de prueba, el algoritmo combina diferentes modelos y aplica estrategias de votación para detectar objetos de diversas escalas en imágenes de VANT. El aumento de datos también presenta una solución a la deficiencia de conjuntos de datos de imágenes de drones. Experimentamos con dos conjuntos de datos específicos en el dominio abierto: el conjunto de datos VisDrone y el conjunto de datos AU-AIR. Nuestro enfoque es más práctico y eficiente debido al uso de aprendizaje por transferencia y una estrategia de votación en conjunto de dos niveles en lugar de entrenar modelos personalizados en conjuntos de datos completos. La experimentación muestra una mejora significativa en el mAP para ambos conjuntos de datos, VisDrone y AU-AIR, al emplear el método de aprendizaje por transferencia en conjunto. Además, la utilización de estrategias de votación aumenta aún más la fiabilidad del conjunto, ya que el usuario final puede seleccionar y rastrear los efectos del mecanismo para las predicciones de cajas delimitadoras.