Aprendizaje de Complementariedad Cruzada Modal para el Reconocimiento de la Intensidad de Alimentación de Peces a través de la Fusión Audio-Visual
Autores: Li, Jian; Wei, Yanan; Ma, Wenkai; Wang, Tan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprendizaje de Complementariedad Cruzada Modal para el Reconocimiento de la Intensidad de Alimentación de Peces a través de la Fusión Audio-Visual
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Estudio
Método de fusión cruzada de modalidades
Intensidad de alimentación de peces
Entornos submarinos
Acústico
Datos visuales
Mecanismo de fusión
Mecanismo de atención
Modalidades
Limitaciones
Enfoques unimodales
Pesos de fusión
Condiciones ambientales
Fiabilidad modal
Resultados experimentales
Escenarios submarinos
Monitoreo de acuicultura
Gestión de la acuicultura de precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 7
Citaciones: Sin citaciones
Este estudio presenta un nuevo método de fusión cruzada de modalidades para el reconocimiento preciso de la intensidad de alimentación de los peces en entornos submarinos complejos. Utilizando datos acústicos y visuales de hidrófonos y cámaras, desarrollamos un mecanismo de atención en dos etapas que combina de manera adaptativa la información complementaria de ambas modalidades para superar las limitaciones de los enfoques unimodales. La primera etapa mejora las representaciones modales individuales a través de interacciones cruzadas, mientras que la segunda etapa ajusta dinámicamente los pesos de fusión en función de las condiciones ambientales y la fiabilidad modal. Los resultados experimentales demuestran que nuestro método supera significativamente a los enfoques unimodales y de fusión convencionales, logrando una precisión superior en escenarios submarinos. Este trabajo proporciona un sólido apoyo técnico para el monitoreo inteligente de la acuicultura y la gestión de la pesca de precisión.
Descripción
Este estudio presenta un nuevo método de fusión cruzada de modalidades para el reconocimiento preciso de la intensidad de alimentación de los peces en entornos submarinos complejos. Utilizando datos acústicos y visuales de hidrófonos y cámaras, desarrollamos un mecanismo de atención en dos etapas que combina de manera adaptativa la información complementaria de ambas modalidades para superar las limitaciones de los enfoques unimodales. La primera etapa mejora las representaciones modales individuales a través de interacciones cruzadas, mientras que la segunda etapa ajusta dinámicamente los pesos de fusión en función de las condiciones ambientales y la fiabilidad modal. Los resultados experimentales demuestran que nuestro método supera significativamente a los enfoques unimodales y de fusión convencionales, logrando una precisión superior en escenarios submarinos. Este trabajo proporciona un sólido apoyo técnico para el monitoreo inteligente de la acuicultura y la gestión de la pesca de precisión.