Preprocesamiento de imágenes avanzado y modelado integrado para la clasificación de imágenes de plantas con UAV
Autores: Tariku, Girma; Ghiglieno, Isabella; Simonetto, Anna; Gentilin, Fulvio; Armiraglio, Stefano; Gilioli, Gianni; Serina, Ivan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Preprocesamiento de imágenes avanzado y modelado integrado para la clasificación de imágenes de plantas con UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Identificación
Especies de plantas
UAVs
Preprocesamiento de imágenes
Aprendizaje profundo
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La identificación automática de especies de plantas utilizando vehículos aéreos no tripulados (UAV) es una herramienta valiosa para la investigación ecológica. Sin embargo, desafíos como la reducción de la resolución espacial debido a operaciones a gran altitud, la degradación de la imagen por la óptica de la cámara y las limitaciones del sensor, y la pérdida de información causada por las sombras del terreno obstaculizan la clasificación precisa de especies de plantas a partir de imágenes de UAV. Este estudio aborda estos problemas proponiendo un novedoso pipeline de preprocesamiento de imágenes y evaluando su impacto en el rendimiento del modelo. Nuestro enfoque mejora la calidad de la imagen a través de un pipeline de múltiples pasos que incluye Redes Generativas Antagónicas de Superresolución Mejorada (ESRGAN) para la mejora de la resolución, Ecualización de Histograma Adaptativa Limitada por Contraste (CLAHE) para la mejora del contraste y ajustes de balance de blancos para una representación precisa del color. Estos pasos de preprocesamiento aseguran datos de entrada de alta calidad, lo que conduce a un mejor rendimiento del modelo. Para la extracción de características y clasificación, empleamos una red neuronal convolucional profunda VGG-16 preentrenada, seguida de clasificadores de aprendizaje automático, incluyendo Máquina de Vectores de Soporte (SVM), bosque aleatorio (RF) y Aumento de Gradiente Extremo (XGBoost). Este enfoque híbrido, que combina el aprendizaje profundo para la extracción de características con el aprendizaje automático para la clasificación, no solo mejora la precisión de la clasificación, sino que también reduce los requisitos de recursos computacionales en comparación con depender únicamente de modelos de aprendizaje profundo. Notablemente, el modelo VGG-16 + SVM logró una precisión excepcional del 97.88% en un conjunto de datos preprocesados con ESRGAN y ajustes de balance de blancos, con una precisión del 97.9%, un recall del 97.8% y un puntaje F1 de 0.978. A través de un estudio comparativo integral, demostramos que el marco propuesto, utilizando VGG-16 para la extracción de características, SVM para la clasificación y imágenes preprocesadas con ESRGAN y ajustes de balance de blancos, logra un rendimiento superior en la identificación de especies de plantas a partir de imágenes de UAV.
Descripción
La identificación automática de especies de plantas utilizando vehículos aéreos no tripulados (UAV) es una herramienta valiosa para la investigación ecológica. Sin embargo, desafíos como la reducción de la resolución espacial debido a operaciones a gran altitud, la degradación de la imagen por la óptica de la cámara y las limitaciones del sensor, y la pérdida de información causada por las sombras del terreno obstaculizan la clasificación precisa de especies de plantas a partir de imágenes de UAV. Este estudio aborda estos problemas proponiendo un novedoso pipeline de preprocesamiento de imágenes y evaluando su impacto en el rendimiento del modelo. Nuestro enfoque mejora la calidad de la imagen a través de un pipeline de múltiples pasos que incluye Redes Generativas Antagónicas de Superresolución Mejorada (ESRGAN) para la mejora de la resolución, Ecualización de Histograma Adaptativa Limitada por Contraste (CLAHE) para la mejora del contraste y ajustes de balance de blancos para una representación precisa del color. Estos pasos de preprocesamiento aseguran datos de entrada de alta calidad, lo que conduce a un mejor rendimiento del modelo. Para la extracción de características y clasificación, empleamos una red neuronal convolucional profunda VGG-16 preentrenada, seguida de clasificadores de aprendizaje automático, incluyendo Máquina de Vectores de Soporte (SVM), bosque aleatorio (RF) y Aumento de Gradiente Extremo (XGBoost). Este enfoque híbrido, que combina el aprendizaje profundo para la extracción de características con el aprendizaje automático para la clasificación, no solo mejora la precisión de la clasificación, sino que también reduce los requisitos de recursos computacionales en comparación con depender únicamente de modelos de aprendizaje profundo. Notablemente, el modelo VGG-16 + SVM logró una precisión excepcional del 97.88% en un conjunto de datos preprocesados con ESRGAN y ajustes de balance de blancos, con una precisión del 97.9%, un recall del 97.8% y un puntaje F1 de 0.978. A través de un estudio comparativo integral, demostramos que el marco propuesto, utilizando VGG-16 para la extracción de características, SVM para la clasificación y imágenes preprocesadas con ESRGAN y ajustes de balance de blancos, logra un rendimiento superior en la identificación de especies de plantas a partir de imágenes de UAV.