logo móvil
Contáctanos

Clasificación Automática de Imágenes Submarinas de Ballena Enana Minke

Autores: Konovalov, Dmitry A.; Swinhoe, Natalie; Efremova, Dina B.; Birtles, R. Alastair; Kusetic, Martha; Hillcoat, Suzanne; Curnock, Matthew I.; Williams, Genevieve; Sheaves, Marcus

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Clasificación Automática de Imágenes Submarinas de Ballena Enana Minke


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Ballenas minke
Aguas australianas
Gran Barrera de Coral
Estudio de foto-identificación
Redes Neuronales Convolucionales
Grabaciones en video

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Una agregación predecible de ballenas enanas minke (subespecie Balaenoptera acutorostrata) ocurre anualmente en las aguas australianas de la Gran Barrera de Coral del norte en junio-julio, que ha sido objeto de un estudio de foto-identificación a largo plazo. Investigadores del Proyecto Ballena Minke (MWP) de la Universidad James Cook recopilan grandes volúmenes de imágenes digitales submarinas cada temporada (por ejemplo, 1.8TB en 2018), gran parte de las cuales son aportadas por científicos ciudadanos. El procesamiento y análisis manual de esta cantidad de datos se había vuelto inviable, y las Redes Neuronales Convolucionales (CNN) ofrecieron una solución potencial. Nuestro estudio buscó diseñar y entrenar una CNN que pudiera detectar ballenas a partir de grabaciones de video en entornos submarinos complejos cerca de la superficie y diferenciar las ballenas de personas, barcos y equipos recreativos. Modificamos CNNs de clasificación conocidas para localizar ballenas en fotogramas de video e imágenes digitales fijas. La alta precisión de clasificación requerida se logró al descubrir una técnica de entrenamiento de etiquetado negativo efectiva. Esto resultó en una tasa de clasificación de falsos positivos de menos del 1% y una tasa de falsos negativos por debajo del 0.1%. La versión final del pipeline CNN operativa procesó todos los videos (con un intervalo de 10 fotogramas) en aproximadamente cuatro días (funcionando en dos GPUs) entregando 1.95 millones de imágenes clasificadas.

Otros recursos que podrían interesarte

Temas Virtualpro