BEHAVE-UAV: Una tubería de datos sintéticos consciente del comportamiento para la detección de vida silvestre a partir de imágenes de UAV
Autores: Taskina, Larisa; Vorobyev, Kirill; Abakumov, Leonid; Kazarkin, Timofey
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
BEHAVE-UAV: Una tubería de datos sintéticos consciente del comportamiento para la detección de vida silvestre a partir de imágenes de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículos aéreos no tripulados
Monitoreo de vida silvestre
Pipeline de datos sintéticos
Detección de objetos
Análisis de comportamiento
Conjuntos de datos de entrenamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los vehículos aéreos no tripulados (VANT) se utilizan cada vez más para monitorear la vida silvestre, pero entrenar detectores robustos aún requiere grandes conjuntos de datos anotados de manera consistente, recolectados a través de estaciones, hábitats y altitudes de vuelo. En la práctica, tales datos son escasos y costosos de etiquetar, especialmente cuando los animales ocupan solo unos pocos píxeles en imágenes de alta altitud. Presentamos un pipeline de datos sintéticos consciente del comportamiento, implementado en Unreal Engine 5, que combina agentes animales parametrizados, entornos variadamente procedimentales y trayectorias de cámara precisas de VANT para generar grandes volúmenes de imágenes etiquetadas de VANT sin anotación manual. Cada cuadro se exporta con máscaras de instancia, cuadros delimitadores en formato YOLO y metadatos de seguimiento, lo que permite tanto la detección de objetos como el análisis de comportamiento posterior. Usando este pipeline, estudiamos YOLOv8s entrenados bajo seis regímenes que varían según la fuente de datos (sintética versus real) y la resolución de entrada, incluyendo un barrido de ajuste fino fraccionado en un conjunto de datos público de ciervos. El preentrenamiento sintético de alta resolución a 1280 px mejora sustancialmente la detección de objetos pequeños y, después de un ajuste fino con solo el 50% de las imágenes reales, recupera casi todo el rendimiento alcanzado con el conjunto real completamente etiquetado. A una resolución más baja (640 px), la inicialización sintética iguala el entrenamiento solo con datos reales después del ajuste fino, lo que indica que los datos sintéticos no perjudican y pueden acelerar la convergencia. Estos resultados muestran que los datos sintéticos conscientes del comportamiento pueden hacer que el monitoreo de vida silvestre con VANT sea más eficiente en muestras mientras se reduce el costo de anotación.
Descripción
Los vehículos aéreos no tripulados (VANT) se utilizan cada vez más para monitorear la vida silvestre, pero entrenar detectores robustos aún requiere grandes conjuntos de datos anotados de manera consistente, recolectados a través de estaciones, hábitats y altitudes de vuelo. En la práctica, tales datos son escasos y costosos de etiquetar, especialmente cuando los animales ocupan solo unos pocos píxeles en imágenes de alta altitud. Presentamos un pipeline de datos sintéticos consciente del comportamiento, implementado en Unreal Engine 5, que combina agentes animales parametrizados, entornos variadamente procedimentales y trayectorias de cámara precisas de VANT para generar grandes volúmenes de imágenes etiquetadas de VANT sin anotación manual. Cada cuadro se exporta con máscaras de instancia, cuadros delimitadores en formato YOLO y metadatos de seguimiento, lo que permite tanto la detección de objetos como el análisis de comportamiento posterior. Usando este pipeline, estudiamos YOLOv8s entrenados bajo seis regímenes que varían según la fuente de datos (sintética versus real) y la resolución de entrada, incluyendo un barrido de ajuste fino fraccionado en un conjunto de datos público de ciervos. El preentrenamiento sintético de alta resolución a 1280 px mejora sustancialmente la detección de objetos pequeños y, después de un ajuste fino con solo el 50% de las imágenes reales, recupera casi todo el rendimiento alcanzado con el conjunto real completamente etiquetado. A una resolución más baja (640 px), la inicialización sintética iguala el entrenamiento solo con datos reales después del ajuste fino, lo que indica que los datos sintéticos no perjudican y pueden acelerar la convergencia. Estos resultados muestran que los datos sintéticos conscientes del comportamiento pueden hacer que el monitoreo de vida silvestre con VANT sea más eficiente en muestras mientras se reduce el costo de anotación.