Detección y conteo de animales a partir de imágenes de UAV utilizando redes neuronales convolucionales
Autores: Rani, Kristina; Blagojevi, Boko; Bezdan, Atila; Ivoevi, Bojana; Tubi, Bojan; Vraneevi, Milica; Pejak, Branislav; Crnojevi, Vladimir; Marko, Oskar
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección y conteo de animales a partir de imágenes de UAV utilizando redes neuronales convolucionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones
Aprendizaje profundo
Redes neuronales
Detección de poblaciones de ciervos
Arquitectura YOLO
Procesamiento de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En la última década, los pequeños vehículos aéreos no tripulados (UAV/drones) se han vuelto cada vez más populares en la observación aérea de grandes áreas para muchos propósitos, como el monitoreo de áreas agrícolas, el seguimiento de animales salvajes en sus hábitats naturales y el conteo de ganado. Junto con el aprendizaje profundo, permiten el procesamiento y reconocimiento automático de imágenes. El objetivo de este trabajo fue detectar y contar la población de ciervos en el noroeste de Serbia a partir de tales imágenes utilizando redes neuronales profundas, un proceso tedioso que de otro modo requeriría mucho tiempo y esfuerzo. En este documento, presentamos y comparamos el rendimiento de varias arquitecturas de red de última generación, entrenadas en un conjunto de imágenes anotadas manualmente, y las utilizamos para predecir la presencia de objetos en el resto del conjunto de datos. Implementamos tres versiones de la arquitectura You Only Look Once (YOLO) y un Detector de Multibox de Tiro Único (SSD) para detectar ciervos en un entorno forestal denso y medimos su rendimiento basado en la precisión media promedio (mAP), precisión, recuperación y puntuación F1. Además, también evaluamos los modelos en función de su rendimiento en tiempo real. Los resultados mostraron que los modelos seleccionados fueron capaces de detectar ciervos con una precisión media promedio de hasta 70.45% y una puntuación de confianza de hasta un 99%. La mayor precisión fue alcanzada por la cuarta versión de YOLO con un 86%, así como el mayor valor de recuperación de 75%. Su versión comprimida logró resultados ligeramente inferiores, con un 83% de mAP en su mejor caso, pero demostró un rendimiento en tiempo real cuatro veces mejor. La función de conteo se aplicó a los modelos de mejor rendimiento, proporcionándonos la distribución exacta de ciervos en todas las imágenes. Yolov4 obtuvo un error del 8.3% en el conteo, mientras que Yolov4-tiny confundió 12 ciervos, lo que representó un error del 7.1%.
Descripción
En la última década, los pequeños vehículos aéreos no tripulados (UAV/drones) se han vuelto cada vez más populares en la observación aérea de grandes áreas para muchos propósitos, como el monitoreo de áreas agrícolas, el seguimiento de animales salvajes en sus hábitats naturales y el conteo de ganado. Junto con el aprendizaje profundo, permiten el procesamiento y reconocimiento automático de imágenes. El objetivo de este trabajo fue detectar y contar la población de ciervos en el noroeste de Serbia a partir de tales imágenes utilizando redes neuronales profundas, un proceso tedioso que de otro modo requeriría mucho tiempo y esfuerzo. En este documento, presentamos y comparamos el rendimiento de varias arquitecturas de red de última generación, entrenadas en un conjunto de imágenes anotadas manualmente, y las utilizamos para predecir la presencia de objetos en el resto del conjunto de datos. Implementamos tres versiones de la arquitectura You Only Look Once (YOLO) y un Detector de Multibox de Tiro Único (SSD) para detectar ciervos en un entorno forestal denso y medimos su rendimiento basado en la precisión media promedio (mAP), precisión, recuperación y puntuación F1. Además, también evaluamos los modelos en función de su rendimiento en tiempo real. Los resultados mostraron que los modelos seleccionados fueron capaces de detectar ciervos con una precisión media promedio de hasta 70.45% y una puntuación de confianza de hasta un 99%. La mayor precisión fue alcanzada por la cuarta versión de YOLO con un 86%, así como el mayor valor de recuperación de 75%. Su versión comprimida logró resultados ligeramente inferiores, con un 83% de mAP en su mejor caso, pero demostró un rendimiento en tiempo real cuatro veces mejor. La función de conteo se aplicó a los modelos de mejor rendimiento, proporcionándonos la distribución exacta de ciervos en todas las imágenes. Yolov4 obtuvo un error del 8.3% en el conteo, mientras que Yolov4-tiny confundió 12 ciervos, lo que representó un error del 7.1%.