Investigación sobre la optimización de la clasificación de orígenes de manzana basada en la regresión de ángulo mínimo en la selección de instancias
Autores: Li, Bin; Wang, Yuqi; Li, Lisha; Liu, Yande
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Investigación sobre la optimización de la clasificación de orígenes de manzana basada en la regresión de ángulo mínimo en la selección de instancias
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Aprendizaje automático
Espectroscopía de infrarrojo cercano
Selección de instancias
Regresión de menor ángulo
Clasificación
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El aprendizaje automático se utiliza ampliamente en la espectroscopia de infrarrojo cercano (NIRS) para la calificación de frutas. Sin embargo, el conjunto de entrenamiento directamente dividido utilizado contiene muestras redundantes, lo que puede introducir errores en el modelo. Los métodos de selección de instancias (IS) basados en la distancia euclidiana y en el vecino más cercano (K-NN) se utilizan ampliamente para eliminar muestras inútiles debido a su accesibilidad. Sin embargo, estos métodos suelen tener alta precisión y baja compresión o viceversa. Para comprimir el tamaño de la muestra mientras se mejora la precisión, se propuso el método de regresión del ángulo mínimo (LAR) para la selección de instancias de clasificación, y se realizó un experimento de discriminación en un total de cuatro orígenes de 952 manzanas. Los conjuntos de muestras se dividieron en el conjunto de entrenamiento bruto y el conjunto de pruebas; las muestras de entrenamiento óptimas fueron seleccionadas utilizando el método de selección de instancias basado en LAR (LARIS), y se compararon con los otros cuatro métodos de selección. Los resultados mostraron que el 26.9% de las muestras de entrenamiento en bruto fueron seleccionadas utilizando LARIS, y el modelo basado en estas muestras de entrenamiento tuvo la mayor precisión. Por lo tanto, el modelo de clasificación del origen de la manzana basado en LARIS puede lograr el objetivo de alta precisión y compresión y proporcionar apoyo experimental para el algoritmo de regresión del ángulo mínimo en la selección de instancias de clasificación.
Descripción
El aprendizaje automático se utiliza ampliamente en la espectroscopia de infrarrojo cercano (NIRS) para la calificación de frutas. Sin embargo, el conjunto de entrenamiento directamente dividido utilizado contiene muestras redundantes, lo que puede introducir errores en el modelo. Los métodos de selección de instancias (IS) basados en la distancia euclidiana y en el vecino más cercano (K-NN) se utilizan ampliamente para eliminar muestras inútiles debido a su accesibilidad. Sin embargo, estos métodos suelen tener alta precisión y baja compresión o viceversa. Para comprimir el tamaño de la muestra mientras se mejora la precisión, se propuso el método de regresión del ángulo mínimo (LAR) para la selección de instancias de clasificación, y se realizó un experimento de discriminación en un total de cuatro orígenes de 952 manzanas. Los conjuntos de muestras se dividieron en el conjunto de entrenamiento bruto y el conjunto de pruebas; las muestras de entrenamiento óptimas fueron seleccionadas utilizando el método de selección de instancias basado en LAR (LARIS), y se compararon con los otros cuatro métodos de selección. Los resultados mostraron que el 26.9% de las muestras de entrenamiento en bruto fueron seleccionadas utilizando LARIS, y el modelo basado en estas muestras de entrenamiento tuvo la mayor precisión. Por lo tanto, el modelo de clasificación del origen de la manzana basado en LARIS puede lograr el objetivo de alta precisión y compresión y proporcionar apoyo experimental para el algoritmo de regresión del ángulo mínimo en la selección de instancias de clasificación.