Clasificación Automática de Imágenes Submarinas de Ballena Enana Minke
Autores: Konovalov, Dmitry A.; Swinhoe, Natalie; Efremova, Dina B.; Birtles, R. Alastair; Kusetic, Martha; Hillcoat, Suzanne; Curnock, Matthew I.; Williams, Genevieve; Sheaves, Marcus
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Clasificación Automática de Imágenes Submarinas de Ballena Enana Minke
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Ballenas minke
Aguas australianas
Gran Barrera de Coral
Estudio de foto-identificación
Redes Neuronales Convolucionales
Grabaciones en video
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Una agregación predecible de ballenas enanas minke (subespecie Balaenoptera acutorostrata) ocurre anualmente en las aguas australianas de la Gran Barrera de Coral del norte en junio-julio, que ha sido objeto de un estudio de foto-identificación a largo plazo. Investigadores del Proyecto Ballena Minke (MWP) de la Universidad James Cook recopilan grandes volúmenes de imágenes digitales submarinas cada temporada (por ejemplo, 1.8TB en 2018), gran parte de las cuales son aportadas por científicos ciudadanos. El procesamiento y análisis manual de esta cantidad de datos se había vuelto inviable, y las Redes Neuronales Convolucionales (CNN) ofrecieron una solución potencial. Nuestro estudio buscó diseñar y entrenar una CNN que pudiera detectar ballenas a partir de grabaciones de video en entornos submarinos complejos cerca de la superficie y diferenciar las ballenas de personas, barcos y equipos recreativos. Modificamos CNNs de clasificación conocidas para localizar ballenas en fotogramas de video e imágenes digitales fijas. La alta precisión de clasificación requerida se logró al descubrir una técnica de entrenamiento de etiquetado negativo efectiva. Esto resultó en una tasa de clasificación de falsos positivos de menos del 1% y una tasa de falsos negativos por debajo del 0.1%. La versión final del pipeline CNN operativa procesó todos los videos (con un intervalo de 10 fotogramas) en aproximadamente cuatro días (funcionando en dos GPUs) entregando 1.95 millones de imágenes clasificadas.
Descripción
Una agregación predecible de ballenas enanas minke (subespecie Balaenoptera acutorostrata) ocurre anualmente en las aguas australianas de la Gran Barrera de Coral del norte en junio-julio, que ha sido objeto de un estudio de foto-identificación a largo plazo. Investigadores del Proyecto Ballena Minke (MWP) de la Universidad James Cook recopilan grandes volúmenes de imágenes digitales submarinas cada temporada (por ejemplo, 1.8TB en 2018), gran parte de las cuales son aportadas por científicos ciudadanos. El procesamiento y análisis manual de esta cantidad de datos se había vuelto inviable, y las Redes Neuronales Convolucionales (CNN) ofrecieron una solución potencial. Nuestro estudio buscó diseñar y entrenar una CNN que pudiera detectar ballenas a partir de grabaciones de video en entornos submarinos complejos cerca de la superficie y diferenciar las ballenas de personas, barcos y equipos recreativos. Modificamos CNNs de clasificación conocidas para localizar ballenas en fotogramas de video e imágenes digitales fijas. La alta precisión de clasificación requerida se logró al descubrir una técnica de entrenamiento de etiquetado negativo efectiva. Esto resultó en una tasa de clasificación de falsos positivos de menos del 1% y una tasa de falsos negativos por debajo del 0.1%. La versión final del pipeline CNN operativa procesó todos los videos (con un intervalo de 10 fotogramas) en aproximadamente cuatro días (funcionando en dos GPUs) entregando 1.95 millones de imágenes clasificadas.