logo móvil
Contáctanos

DiffusionFR: Reconocimiento de Especies de Peces en Escenarios Borrosos a Través de Difusión y Atención

Autores: Wang, Guoying; Shi, Bing; Yi, Xiaomei; Wu, Peng; Kong, Linjun; Mo, Lufeng

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

DiffusionFR: Reconocimiento de Especies de Peces en Escenarios Borrosos a Través de Difusión y Atención


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Zootecnia

Palabras clave

Modelo de difusión
Mecanismo de atención
Reconocimiento de imágenes de peces
Escenarios borrosos
Modelos de aprendizaje profundo
Conjunto de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 7

Citaciones: Sin citaciones


Descripción
Los escenarios borrosos, como los reflejos de luz y las ondulaciones del agua, a menudo afectan la claridad y la relación señal-ruido de las imágenes de peces, lo que plantea desafíos significativos para los modelos tradicionales de aprendizaje profundo en el reconocimiento preciso de especies de peces. En primer lugar, los modelos de aprendizaje profundo dependen de una gran cantidad de datos etiquetados. Sin embargo, a menudo es difícil etiquetar datos en escenarios borrosos. En segundo lugar, los modelos de aprendizaje profundo existentes no son lo suficientemente efectivos para el procesamiento de imágenes malas, borrosas y de otro modo inadecuadas, lo que es una razón esencial para su baja tasa de reconocimiento. Se propone un método basado en el modelo de difusión y el mecanismo de atención para el reconocimiento de imágenes de peces en escenarios borrosos, DiffusionFR, para resolver estos problemas y mejorar el rendimiento del reconocimiento de especies de imágenes de peces en escenarios borrosos. Este documento presenta la selección y aplicación de esta técnica de corrección. En el método, DiffusionFR, se diseña un modelo de red de difusión de dos etapas, TSD, para desenfocar imágenes de escenas de peces malas, borrosas y de otro modo inadecuadas para restaurar la claridad, y un módulo de atención aprendible, LAM, está destinado a mejorar la precisión del reconocimiento de peces. Además, se construyó un nuevo conjunto de datos de imágenes de peces en escenarios borrosos, BlurryFish, que se utilizó para validar la efectividad de DiffusionFR, combinando imágenes malas, borrosas y de otro modo inadecuadas del conjunto de datos disponible públicamente Fish4Knowledge. Los resultados experimentales demuestran que DiffusionFR logra un rendimiento excepcional en varios conjuntos de datos. En el conjunto de datos original, DiffusionFR alcanzó la mayor precisión de entrenamiento del 97.55%, así como una puntuación de prueba de precisión Top-1 del 92.02% y una puntuación de prueba de precisión Top-5 del 95.17%. Además, en nueve conjuntos de datos con ruido de reflejo de luz, los valores medios de precisión de entrenamiento alcanzaron un pico del 96.50%, mientras que los valores medios de la prueba de precisión Top-1 y Top-5 fueron los más altos en 90.96% y 94.12%, respectivamente. De manera similar, en tres conjuntos de datos con ruido de ondulación de agua, los valores medios de precisión de entrenamiento alcanzaron un pico del 95.00%, mientras que los valores medios de la prueba de precisión Top-1 y Top-5 fueron los más altos en 89.54% y 92.73%, respectivamente. Estos resultados demuestran que el método muestra una precisión superior y una robustez mejorada en el manejo de conjuntos de datos originales y conjuntos de datos con ruido de reflejo de luz y ondulación de agua.

Otros recursos que podrían interesarte

Temas Virtualpro