Avanzando la taxonomía con aprendizaje automático: un conjunto híbrido para la clasificación de especies y géneros
Autores: Nanni, Loris; Gobbi, Matteo De; Junior, Roger De Almeida Matos; Fusaro, Daniel
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Avanzando la taxonomía con aprendizaje automático: un conjunto híbrido para la clasificación de especies y géneros
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Especies
Aprendizaje automático
Redes neuronales
Máquinas de vectores de soporte
Código de barras de ADN
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 55
Citaciones: Sin citaciones
Tradicionalmente, clasificar especies ha requerido que expertos taxonómicos examinen cuidadosamente características físicas únicas, un proceso complejo y que consume mucho tiempo. El aprendizaje automático ofrece una alternativa prometedora al utilizar la potencia computacional para detectar distinciones sutiles de manera más rápida y precisa. Esta tecnología puede clasificar tanto especies conocidas (descritas) como desconocidas (no descritas), asignando muestras conocidas a especies específicas y agrupando las desconocidas a nivel de género, una mejora sobre la práctica común de etiquetar especies desconocidas como valores atípicos. En este documento, proponemos un enfoque novedoso de conjunto que integra redes neuronales con máquinas de vectores de soporte (SVM). Cada animal está representado por una imagen y su código de barras de ADN. Nuestra investigación investiga la transformación de datos vectoriales unidimensionales en matrices tridimensionales de tres canales utilizando la transformada wavelet discreta (DWT), lo que permite la aplicación de redes neuronales convolucionales (CNN) que han sido pre-entrenadas en grandes conjuntos de datos de imágenes. Nuestro método supera significativamente los enfoques existentes, como se demuestra en varios conjuntos de datos que contienen imágenes de animales y códigos de barras de ADN. Al permitir la clasificación de especies tanto descritas como no descritas, esta investigación representa un gran avance en el monitoreo global de la biodiversidad.
Descripción
Tradicionalmente, clasificar especies ha requerido que expertos taxonómicos examinen cuidadosamente características físicas únicas, un proceso complejo y que consume mucho tiempo. El aprendizaje automático ofrece una alternativa prometedora al utilizar la potencia computacional para detectar distinciones sutiles de manera más rápida y precisa. Esta tecnología puede clasificar tanto especies conocidas (descritas) como desconocidas (no descritas), asignando muestras conocidas a especies específicas y agrupando las desconocidas a nivel de género, una mejora sobre la práctica común de etiquetar especies desconocidas como valores atípicos. En este documento, proponemos un enfoque novedoso de conjunto que integra redes neuronales con máquinas de vectores de soporte (SVM). Cada animal está representado por una imagen y su código de barras de ADN. Nuestra investigación investiga la transformación de datos vectoriales unidimensionales en matrices tridimensionales de tres canales utilizando la transformada wavelet discreta (DWT), lo que permite la aplicación de redes neuronales convolucionales (CNN) que han sido pre-entrenadas en grandes conjuntos de datos de imágenes. Nuestro método supera significativamente los enfoques existentes, como se demuestra en varios conjuntos de datos que contienen imágenes de animales y códigos de barras de ADN. Al permitir la clasificación de especies tanto descritas como no descritas, esta investigación representa un gran avance en el monitoreo global de la biodiversidad.