Utilizando datos estadísticos de distribución geográfica para mejorar el reconocimiento de especies en cero disparos
Autores: Liu, Lei; Han, Boxun; Chen, Feixiang; Mou, Chao; Xu, Fu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Utilizando datos estadísticos de distribución geográfica para mejorar el reconocimiento de especies en cero disparos
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Reconocimiento de especies
Cero disparos
CLIP
Distribución geográfica
Conservación de la biodiversidad
Aprendizaje profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
El reconocimiento de especies es una parte crucial para entender la abundancia y distribución de varios organismos y es importante para la conservación y gestión de la biodiversidad. El reconocimiento de especies basado en visión tradicional y impulsado por aprendizaje profundo requiere grandes cantidades de datos de imágenes bien etiquetados y de alta calidad, cuya recolección es un desafío para especies raras y en peligro de extinción. Además, los métodos de reconocimiento diseñados en función de especies específicas tienen una mala capacidad de generalización y son difíciles de adaptar a nuevos escenarios de reconocimiento de especies. Para abordar estos problemas, el reconocimiento de especies en cero disparos basado en el Pre-entrenamiento Contrastivo de Lenguaje e Imagen (CLIP) se ha convertido en un foco de investigación. Sin embargo, estudios anteriores han utilizado principalmente información descriptiva visual e información taxonómica de las especies para mejorar el rendimiento del reconocimiento en cero disparos, y el uso de características de distribución geográfica de las especies para mejorar el rendimiento del reconocimiento en cero disparos no ha sido explorado. Para llenar este vacío, propusimos un método de reconocimiento de especies en cero disparos impulsado por CLIP que incorpora el conocimiento de la distribución geográfica de las especies. Primero, diseñamos tres indicaciones basadas en los datos estadísticos de distribución geográfica de las especies. Luego, la información de coordenadas de latitud y longitud adjunta a cada imagen en el conjunto de datos de especies se convirtió en direcciones, y se integraron para formar el conocimiento de distribución geográfica de cada especie. Finalmente, los resultados del reconocimiento de especies se derivaron calculando la similitud después de adquirir características mediante el codificador de imágenes y el codificador de texto entrenados de CLIP. Realizamos extensos experimentos en múltiples conjuntos de datos de especies del conjunto de datos iNaturalist 2021, donde las precisiones de reconocimiento en cero disparos de mamíferos, moluscos, reptiles, anfibios, aves e insectos fueron del 44.96%, 15.27%, 17.51%, 9.47%, 28.35% y 7.03%, una mejora del 2.07%, 0.48%, 0.35%, 1.12%, 1.64% y 0.61%, respectivamente, en comparación con CLIP con la indicación predeterminada. Los resultados experimentales muestran que la fusión de datos estadísticos de distribución geográfica puede mejorar efectivamente el rendimiento del reconocimiento de especies en cero disparos, lo que proporciona una nueva forma de utilizar el conocimiento del dominio de las especies.
Descripción
El reconocimiento de especies es una parte crucial para entender la abundancia y distribución de varios organismos y es importante para la conservación y gestión de la biodiversidad. El reconocimiento de especies basado en visión tradicional y impulsado por aprendizaje profundo requiere grandes cantidades de datos de imágenes bien etiquetados y de alta calidad, cuya recolección es un desafío para especies raras y en peligro de extinción. Además, los métodos de reconocimiento diseñados en función de especies específicas tienen una mala capacidad de generalización y son difíciles de adaptar a nuevos escenarios de reconocimiento de especies. Para abordar estos problemas, el reconocimiento de especies en cero disparos basado en el Pre-entrenamiento Contrastivo de Lenguaje e Imagen (CLIP) se ha convertido en un foco de investigación. Sin embargo, estudios anteriores han utilizado principalmente información descriptiva visual e información taxonómica de las especies para mejorar el rendimiento del reconocimiento en cero disparos, y el uso de características de distribución geográfica de las especies para mejorar el rendimiento del reconocimiento en cero disparos no ha sido explorado. Para llenar este vacío, propusimos un método de reconocimiento de especies en cero disparos impulsado por CLIP que incorpora el conocimiento de la distribución geográfica de las especies. Primero, diseñamos tres indicaciones basadas en los datos estadísticos de distribución geográfica de las especies. Luego, la información de coordenadas de latitud y longitud adjunta a cada imagen en el conjunto de datos de especies se convirtió en direcciones, y se integraron para formar el conocimiento de distribución geográfica de cada especie. Finalmente, los resultados del reconocimiento de especies se derivaron calculando la similitud después de adquirir características mediante el codificador de imágenes y el codificador de texto entrenados de CLIP. Realizamos extensos experimentos en múltiples conjuntos de datos de especies del conjunto de datos iNaturalist 2021, donde las precisiones de reconocimiento en cero disparos de mamíferos, moluscos, reptiles, anfibios, aves e insectos fueron del 44.96%, 15.27%, 17.51%, 9.47%, 28.35% y 7.03%, una mejora del 2.07%, 0.48%, 0.35%, 1.12%, 1.64% y 0.61%, respectivamente, en comparación con CLIP con la indicación predeterminada. Los resultados experimentales muestran que la fusión de datos estadísticos de distribución geográfica puede mejorar efectivamente el rendimiento del reconocimiento de especies en cero disparos, lo que proporciona una nueva forma de utilizar el conocimiento del dominio de las especies.