Un método de identificación rápida para variedades de semillas de algodón basado en espectros de infrarrojo cercano y redes generativas adversarias
Autores: Li, Qingxu; Li, Hao; Liu, Renhao; Dong, Xiaofeng; Zhang, Hongzhou; Zhou, Wanhuai
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un método de identificación rápida para variedades de semillas de algodón basado en espectros de infrarrojo cercano y redes generativas adversarias
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
China
Variedades de semillas de algodón
Datos NIR
Modelo GAN-CNIRD
Longitudes de onda características
Clasificación de semillas de algodón
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
China es un importante país productor de algodón con numerosas variedades de algodón, cada una con diferencias significativas en rendimiento y calidad de fibra. Sin embargo, la gestión actual de las variedades de semillas de algodón es desorganizada, lo que resulta en una severa homogeneización y la presencia de variedades falsificadas y mal etiquetadas. La detección de información sobre las variedades de semillas de algodón se ha convertido en un problema crítico para la industria algodonera china. En este estudio, recopilamos datos espectrales de infrarrojo cercano (NIR) de seis variedades de semillas de algodón y construimos un modelo GAN para datos NIR de semillas de algodón (GAN-CNIRD) para generar datos NIR adicionales de semillas de algodón. El método de distancia euclidiana se utilizó para etiquetar los datos NIR generados de acuerdo con las características de los datos NIR reales. Luego aplicamos los algoritmos de Normalización Estándar Variate (SNV), Corrección de Dispersión Multiplicativa (MSC) y Normalización para preprocesar el conjunto de datos combinado de datos NIR de semillas de algodón generados y reales. Se extrajeron longitudes de onda características utilizando los algoritmos Bootstrap Soft Shrinkage (BOSS) y Muestreo Competitivo Ponderado Adaptativo (CARS). Posteriormente, desarrollamos modelos de Análisis Discriminante Lineal (LDA), método de subespacio aleatorio (RSM) y red neuronal convolucional (CNN) para clasificar las variedades de semillas de algodón. Los resultados mostraron que para el modelo LDA, el uso de longitudes de onda características extraídas después del procesamiento de Normalización-BOSS logró el mejor rendimiento con una precisión del 97.00%. Para el modelo RSM, el uso de longitudes de onda características extraídas después del procesamiento de SNV-CARS logró el mejor rendimiento con una precisión del 98.00%. Para el modelo CNN, el uso de longitudes de onda características extraídas después del procesamiento de MSC-CARS logró el mejor rendimiento con una precisión del 100.00%. La ampliación de datos utilizando datos de semillas de algodón generados por GAN-CNIRD mejoró la precisión de los tres modelos óptimos en un 6%, 5% y 6%, respectivamente. Este estudio proporciona una referencia crucial para la detección rápida de información sobre las variedades de semillas de algodón y tiene implicaciones significativas para la gestión estandarizada de las variedades de semillas de algodón.
Descripción
China es un importante país productor de algodón con numerosas variedades de algodón, cada una con diferencias significativas en rendimiento y calidad de fibra. Sin embargo, la gestión actual de las variedades de semillas de algodón es desorganizada, lo que resulta en una severa homogeneización y la presencia de variedades falsificadas y mal etiquetadas. La detección de información sobre las variedades de semillas de algodón se ha convertido en un problema crítico para la industria algodonera china. En este estudio, recopilamos datos espectrales de infrarrojo cercano (NIR) de seis variedades de semillas de algodón y construimos un modelo GAN para datos NIR de semillas de algodón (GAN-CNIRD) para generar datos NIR adicionales de semillas de algodón. El método de distancia euclidiana se utilizó para etiquetar los datos NIR generados de acuerdo con las características de los datos NIR reales. Luego aplicamos los algoritmos de Normalización Estándar Variate (SNV), Corrección de Dispersión Multiplicativa (MSC) y Normalización para preprocesar el conjunto de datos combinado de datos NIR de semillas de algodón generados y reales. Se extrajeron longitudes de onda características utilizando los algoritmos Bootstrap Soft Shrinkage (BOSS) y Muestreo Competitivo Ponderado Adaptativo (CARS). Posteriormente, desarrollamos modelos de Análisis Discriminante Lineal (LDA), método de subespacio aleatorio (RSM) y red neuronal convolucional (CNN) para clasificar las variedades de semillas de algodón. Los resultados mostraron que para el modelo LDA, el uso de longitudes de onda características extraídas después del procesamiento de Normalización-BOSS logró el mejor rendimiento con una precisión del 97.00%. Para el modelo RSM, el uso de longitudes de onda características extraídas después del procesamiento de SNV-CARS logró el mejor rendimiento con una precisión del 98.00%. Para el modelo CNN, el uso de longitudes de onda características extraídas después del procesamiento de MSC-CARS logró el mejor rendimiento con una precisión del 100.00%. La ampliación de datos utilizando datos de semillas de algodón generados por GAN-CNIRD mejoró la precisión de los tres modelos óptimos en un 6%, 5% y 6%, respectivamente. Este estudio proporciona una referencia crucial para la detección rápida de información sobre las variedades de semillas de algodón y tiene implicaciones significativas para la gestión estandarizada de las variedades de semillas de algodón.