Un Análisis Comparativo de Modelos XGBoost y Redes Neuronales para Predecir Algunos Rasgos de Calidad del Fruto del Tomate a Partir de Datos Ambientales y Meteorológicos
Autores: M"hamdi, Oussama; Takács, Sándor; Palotás, Gábor; Ilahy, Riadh; Helyes, Lajos; Pék, Zoltán
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un Análisis Comparativo de Modelos XGBoost y Redes Neuronales para Predecir Algunos Rasgos de Calidad del Fruto del Tomate a Partir de Datos Ambientales y Meteorológicos
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Tomate
Procesamiento
Aprendizaje automático
XGBoost
ANN
Cultivar
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
El tomate como materia prima para el procesamiento es de importancia global y es fundamental en la investigación dietética y agronómica debido a su significado nutricional, económico y de salud. Este estudio exploró el potencial del aprendizaje automático (ML) para predecir la calidad del tomate, utilizando datos de 48 cultivares y 28 ubicaciones en Hungría durante 5 temporadas. Se centró en grados Brix, contenido de licopeno y color (relación a/b) utilizando modelos de aumento extremo de gradiente (XGBoost) y redes neuronales artificiales (ANN). Los resultados revelaron que XGBoost superó consistentemente a ANN, logrando alta precisión en la predicción de grados Brix (R^2 = 0.98, RMSE = 0.07) y contenido de licopeno (R^2 = 0.87, RMSE = 0.61), y destacando en la predicción de color (relación a/b) con un R^2 de 0.93 y un RMSE de 0.03. ANN se quedó atrás, especialmente en la predicción de color, mostrando un valor R^2 negativo de -0.35. El análisis del gráfico resumen de la explicación aditiva de Shapley (SHAP) indicó que ambos modelos son efectivos en la predicción de grados Brix y contenido de licopeno en tomates, destacando diferentes aspectos de los datos. El análisis SHAP destacó la eficiencia de los modelos (especialmente en las predicciones de grados Brix y licopeno) y subrayó la influencia significativa de la elección del cultivar y factores ambientales como el clima y el suelo. Estos hallazgos enfatizan la importancia de seleccionar y ajustar el modelo de ML apropiado para mejorar la agricultura de precisión, subrayando la superioridad de XGBoost en el manejo de datos agronómicos complejos para la evaluación de calidad.
Descripción
El tomate como materia prima para el procesamiento es de importancia global y es fundamental en la investigación dietética y agronómica debido a su significado nutricional, económico y de salud. Este estudio exploró el potencial del aprendizaje automático (ML) para predecir la calidad del tomate, utilizando datos de 48 cultivares y 28 ubicaciones en Hungría durante 5 temporadas. Se centró en grados Brix, contenido de licopeno y color (relación a/b) utilizando modelos de aumento extremo de gradiente (XGBoost) y redes neuronales artificiales (ANN). Los resultados revelaron que XGBoost superó consistentemente a ANN, logrando alta precisión en la predicción de grados Brix (R^2 = 0.98, RMSE = 0.07) y contenido de licopeno (R^2 = 0.87, RMSE = 0.61), y destacando en la predicción de color (relación a/b) con un R^2 de 0.93 y un RMSE de 0.03. ANN se quedó atrás, especialmente en la predicción de color, mostrando un valor R^2 negativo de -0.35. El análisis del gráfico resumen de la explicación aditiva de Shapley (SHAP) indicó que ambos modelos son efectivos en la predicción de grados Brix y contenido de licopeno en tomates, destacando diferentes aspectos de los datos. El análisis SHAP destacó la eficiencia de los modelos (especialmente en las predicciones de grados Brix y licopeno) y subrayó la influencia significativa de la elección del cultivar y factores ambientales como el clima y el suelo. Estos hallazgos enfatizan la importancia de seleccionar y ajustar el modelo de ML apropiado para mejorar la agricultura de precisión, subrayando la superioridad de XGBoost en el manejo de datos agronómicos complejos para la evaluación de calidad.