Fusión de datos y reducción de dimensionalidad para el manejo de plagas en el cultivo de pitahaya
Autores: Chango, Wilson; Mazón-Fierro, Mónica; Erazo, Juan; Mazón-Fierro, Guido; Logroño, Santiago; Peñafiel, Pedro; Sayago, Jaime
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Fusión de datos y reducción de dimensionalidad para el manejo de plagas en el cultivo de pitahaya
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Estudio
Estrategias de fusión de datos
Predicción de plagas
Cultivo de pitahaya
Amazonía ecuatoriana
Fusión temprana
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Este estudio aborda la necesidad crítica de estrategias efectivas de fusión de datos en la predicción de plagas para el cultivo de pitahaya en la Amazonía ecuatoriana, donde fuentes de datos heterogéneas, como sensores ambientales y mediciones de clorofila, ofrecen perspectivas complementarias pero fragmentadas. Los sistemas actuales de monitoreo agrícola a menudo no logran integrar estos flujos de datos, limitando la precisión en la detección temprana de plagas. Para superar esto, comparamos enfoques de fusión temprana y tardía mediante experimentos exhaustivos. La multidimensionalidad es un desafío central: los conjuntos de datos abarcan dimensiones temporales (lecturas de sensores por hora), espaciales (muestras de clorofila a nivel de parcela) y espectrales (reflectancia de clorofila). Aplicamos técnicas de reducción de dimensionalidad, como PCA, KPCA (lineal, polinómico, RBF), t-SNE y UMAP, para preservar la estructura relevante y mejorar la interpretabilidad. Las métricas de evaluación incluyeron la proporción de información retenida (puntuación) y la separabilidad de los grupos (puntuación de silueta). Nuestros resultados demuestran que la fusión temprana produce representaciones integradas superiores, con PCA y KPCA-lineal logrando las puntuaciones más altas (0,96 vs. 0,94), y KPCA-polinómico logrando la mejor definición de grupos (silueta: 0,32 vs. 0,31). La validación estadística mediante la prueba de Friedman ( = 12,00, = 0,02) y comparaciones post hoc de Nemenyi ( < 0,05) confirmaron diferencias significativas en el rendimiento. KPCA-RBF tuvo un desempeño deficiente (puntuación: 0,83; silueta: 0,05), y aunque t-SNE y UMAP ofrecieron ideas visuales, tuvieron un rendimiento inferior en la agrupación (silueta < 0,12). Estos hallazgos hacen tres contribuciones clave. Primero, la fusión temprana captura mejor las interacciones entre dominios antes de la reducción de dimensionalidad, mejorando la robustez de la predicción. Segundo, KPCA-polinómico ofrece un mapeo no lineal efectivo adecuado para la complejidad de los agroecosistemas tropicales. Tercero, nuestro marco, cuando se implementó en Joya de los Sachas, mejoró la precisión en la predicción de plagas en un 12,60% en comparación con la inspección manual, lo que llevó a un uso más dirigido de pesticidas. Esto contribuye a la agricultura de precisión al proporcionar estrategias escalables y de bajo costo para los pequeños agricultores. El trabajo futuro explorará tuberías de fusión híbridas y modelos agnósticos de sensores para ampliar la generalización.
Descripción
Este estudio aborda la necesidad crítica de estrategias efectivas de fusión de datos en la predicción de plagas para el cultivo de pitahaya en la Amazonía ecuatoriana, donde fuentes de datos heterogéneas, como sensores ambientales y mediciones de clorofila, ofrecen perspectivas complementarias pero fragmentadas. Los sistemas actuales de monitoreo agrícola a menudo no logran integrar estos flujos de datos, limitando la precisión en la detección temprana de plagas. Para superar esto, comparamos enfoques de fusión temprana y tardía mediante experimentos exhaustivos. La multidimensionalidad es un desafío central: los conjuntos de datos abarcan dimensiones temporales (lecturas de sensores por hora), espaciales (muestras de clorofila a nivel de parcela) y espectrales (reflectancia de clorofila). Aplicamos técnicas de reducción de dimensionalidad, como PCA, KPCA (lineal, polinómico, RBF), t-SNE y UMAP, para preservar la estructura relevante y mejorar la interpretabilidad. Las métricas de evaluación incluyeron la proporción de información retenida (puntuación) y la separabilidad de los grupos (puntuación de silueta). Nuestros resultados demuestran que la fusión temprana produce representaciones integradas superiores, con PCA y KPCA-lineal logrando las puntuaciones más altas (0,96 vs. 0,94), y KPCA-polinómico logrando la mejor definición de grupos (silueta: 0,32 vs. 0,31). La validación estadística mediante la prueba de Friedman ( = 12,00, = 0,02) y comparaciones post hoc de Nemenyi ( < 0,05) confirmaron diferencias significativas en el rendimiento. KPCA-RBF tuvo un desempeño deficiente (puntuación: 0,83; silueta: 0,05), y aunque t-SNE y UMAP ofrecieron ideas visuales, tuvieron un rendimiento inferior en la agrupación (silueta < 0,12). Estos hallazgos hacen tres contribuciones clave. Primero, la fusión temprana captura mejor las interacciones entre dominios antes de la reducción de dimensionalidad, mejorando la robustez de la predicción. Segundo, KPCA-polinómico ofrece un mapeo no lineal efectivo adecuado para la complejidad de los agroecosistemas tropicales. Tercero, nuestro marco, cuando se implementó en Joya de los Sachas, mejoró la precisión en la predicción de plagas en un 12,60% en comparación con la inspección manual, lo que llevó a un uso más dirigido de pesticidas. Esto contribuye a la agricultura de precisión al proporcionar estrategias escalables y de bajo costo para los pequeños agricultores. El trabajo futuro explorará tuberías de fusión híbridas y modelos agnósticos de sensores para ampliar la generalización.