Síntesis de datos para la estimación del rendimiento de biomasa de alfalfa
Autores: Vance, Jonathan; Rasheed, Khaled; Missaoui, Ali; Maier, Frederick W.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Síntesis de datos para la estimación del rendimiento de biomasa de alfalfa
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Alfalfa
Datos
Aprendizaje automático
Rendimientos de biomasa
Modelos de entrenamiento
Rendimientos de cultivos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La alfalfa es fundamental para la seguridad alimentaria global, y sus datos son abundantes a nivel nacional en los Estados Unidos, pero a menudo escasos a nivel local, lo que limita el rendimiento potencial de los modelos de aprendizaje automático (ML) en la predicción de los rendimientos de biomasa de la alfalfa. Entrenar modelos de ML solo con datos locales resulta en una precisión de estimación muy baja cuando los conjuntos de datos son muy pequeños. Por lo tanto, exploramos la síntesis de datos no locales para estimar los rendimientos de biomasa etiquetados como altos, medios o bajos. Una opción para remediar la escasez de datos locales es entrenar modelos utilizando datos no locales; sin embargo, esto solo funciona tan bien como usar datos locales. Por lo tanto, proponemos un nuevo proceso que entrena modelos utilizando datos sintetizados a partir de datos no locales para estimar los rendimientos de cultivos locales. Nuestro proceso, entrenamiento no local sintetizado (SNLT pronunciado como luz solar), logra una mejora del 42.9% de precisión sobre los mejores resultados de los entrenamientos regulares no locales y locales en nuestro conjunto de datos objetivo muy pequeño. Este proceso produjo la mayor precisión del 85.7% con un clasificador de árbol de decisión. A partir de estos resultados, concluimos que SNLT puede ser una herramienta útil para ayudar a estimar los rendimientos de cultivos con ML. Además, proponemos una aplicación de software llamada Predice Tus Cultivos (PYCS pronunciado como Piscis) diseñada para ayudar a los agricultores e investigadores a estimar y predecir los rendimientos de cultivos basados en modelos preentrenados.
Descripción
La alfalfa es fundamental para la seguridad alimentaria global, y sus datos son abundantes a nivel nacional en los Estados Unidos, pero a menudo escasos a nivel local, lo que limita el rendimiento potencial de los modelos de aprendizaje automático (ML) en la predicción de los rendimientos de biomasa de la alfalfa. Entrenar modelos de ML solo con datos locales resulta en una precisión de estimación muy baja cuando los conjuntos de datos son muy pequeños. Por lo tanto, exploramos la síntesis de datos no locales para estimar los rendimientos de biomasa etiquetados como altos, medios o bajos. Una opción para remediar la escasez de datos locales es entrenar modelos utilizando datos no locales; sin embargo, esto solo funciona tan bien como usar datos locales. Por lo tanto, proponemos un nuevo proceso que entrena modelos utilizando datos sintetizados a partir de datos no locales para estimar los rendimientos de cultivos locales. Nuestro proceso, entrenamiento no local sintetizado (SNLT pronunciado como luz solar), logra una mejora del 42.9% de precisión sobre los mejores resultados de los entrenamientos regulares no locales y locales en nuestro conjunto de datos objetivo muy pequeño. Este proceso produjo la mayor precisión del 85.7% con un clasificador de árbol de decisión. A partir de estos resultados, concluimos que SNLT puede ser una herramienta útil para ayudar a estimar los rendimientos de cultivos con ML. Además, proponemos una aplicación de software llamada Predice Tus Cultivos (PYCS pronunciado como Piscis) diseñada para ayudar a los agricultores e investigadores a estimar y predecir los rendimientos de cultivos basados en modelos preentrenados.