logo móvil
Contáctanos

Convolución Re-Parametrizada Mejorada para la Detección de Vida Silvestre en Regiones Vecinas del Suroeste de China

Autores: Mao, Wenjie; Li, Gang; Li, Xiaowei

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Convolución Re-Parametrizada Mejorada para la Detección de Vida Silvestre en Regiones Vecinas del Suroeste de China


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Zootecnia

Palabras clave

Vida silvestre
Trampas de cámara
Detector de objetos
YOLOv6-N
Precisión de detección
Rendimiento del modelo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 9

Citaciones: Sin citaciones


Descripción
Para detectar de manera autónoma imágenes de vida silvestre capturadas por trampas de cámara en una plataforma con recursos limitados y abordar desafíos como filtrar fotos sin objetos óptimos, así como clasificar y localizar especies en fotos con objetos, introducimos un detector de objetos de vida silvestre especializado adaptado para trampas de cámara. Este detector se desarrolla utilizando un conjunto de datos adquirido por el Grupo de Trabajo Saola (SWG) a través de trampas de cámara desplegadas en Vietnam y Laos. Utilizando el algoritmo de detección de objetos YOLOv6-N como base, el detector se mejora con un optimizador adaptado para mejorar el rendimiento del modelo. Introducimos deliberadamente ramas convolucionales asimétricas para mejorar la capacidad de caracterización de características de la red Backbone. Además, optimizamos el Neck y utilizamos la pérdida CIoU para mejorar el rendimiento de detección. Para el despliegue cuantitativo, refinamos el RepOptimizer para entrenar una red de estilo VGG puro. Los resultados experimentales demuestran que nuestro método propuesto permite al modelo alcanzar una precisión de detección del 88.3% en el conjunto de datos de vida silvestre de este documento. Esta precisión es un 3.1% más alta que YOLOv6-N, y supera a YOLOv7-T y YOLOv8-N en un 5.5% y un 2.8%, respectivamente. El modelo mantiene consistentemente su rendimiento de detección incluso después de la cuantización a la precisión INT8, logrando una velocidad de inferencia de solo 6.15 ms para una sola imagen en el dispositivo NVIDIA Jetson Xavier NX. Las mejoras que introducimos sobresalen en tareas relacionadas con el reconocimiento de imágenes de vida silvestre y la localización de objetos capturados por trampas de cámara, proporcionando soluciones prácticas para mejorar el monitoreo de la vida silvestre y facilitar la adquisición eficiente de datos. Nuestro trabajo actual representa un avance significativo hacia un sistema de observación animal completamente automatizado en aplicaciones de campo en tiempo real.

Otros recursos que podrían interesarte

Temas Virtualpro