Aprendizaje automático de imputación de datos y predicción del tamaño del grupo de forrajeo en una araña cleptoparasitaria
Autores: Su, Yong-Chao; Wu, Cheng-Yu; Yang, Cheng-Hong; Li, Bo-Sheng; Moi, Sin-Hua; Lin, Yu-Da
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Aprendizaje automático de imputación de datos y predicción del tamaño del grupo de forrajeo en una araña cleptoparasitaria
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Análisis de costo-beneficio
Tamaño del grupo de forrajeo
Tamaño de recurso
Imputación de datos
Algoritmos de aprendizaje automático
Arañas cleptoparásitas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El análisis de coste-beneficio se utiliza ampliamente para elucidar la asociación entre el tamaño del grupo de forrajeo y el tamaño de los recursos. A pesar de los avances en el desarrollo de marcos teóricos, sin embargo, los sistemas empíricos utilizados para las pruebas se ven obstaculizados por las incertidumbres de las encuestas de campo y los datos incompletos. Este estudio desarrolló tres enfoques para la imputación de datos basados en algoritmos de aprendizaje automático (ML) con el objetivo de rescatar valiosos datos de campo. Utilizando 163 telarañas de arañas hospedadoras (132 datos completos y 31 datos incompletos), nuestros resultados indicaron que la imputación de datos basada en el algoritmo de bosque aleatorio superó a los árboles de clasificación y regresión, el vecino más cercano, y otros enfoques convencionales (la prueba de rango con signo de Wilcoxon y la diferencia de correlación tienen un valor de < 0.001-0.030). Luego utilizamos datos rescatados basados en un sistema natural que involucra arañas cleptoparásitas de Taiwán y Vietnam (, Theridiidae) para probar la ocurrencia y el tamaño del grupo de cleptoparásitos en poblaciones naturales. Nuestros resultados de modelado de trayectoria de mínimos cuadrados parciales (PLS-PM) demostraron que el tamaño de la telaraña hospedadora ( = 6.890, = 0.000) es una característica significativa que afecta el tamaño del grupo. El tamaño del recurso ( = 2.590, = 0.010) y el microclima ( = 3.230, = 0.001) son características significativas que afectan la presencia de cleptoparásitos. La prueba de conformación de la distribución del tamaño del grupo al modelo de distribución libre ideal (IFD) reveló que las predicciones relacionadas con el tamaño del recurso per cápita estaban subestimadas (pendientes medias de remuestreo bootstrap
Descripción
El análisis de coste-beneficio se utiliza ampliamente para elucidar la asociación entre el tamaño del grupo de forrajeo y el tamaño de los recursos. A pesar de los avances en el desarrollo de marcos teóricos, sin embargo, los sistemas empíricos utilizados para las pruebas se ven obstaculizados por las incertidumbres de las encuestas de campo y los datos incompletos. Este estudio desarrolló tres enfoques para la imputación de datos basados en algoritmos de aprendizaje automático (ML) con el objetivo de rescatar valiosos datos de campo. Utilizando 163 telarañas de arañas hospedadoras (132 datos completos y 31 datos incompletos), nuestros resultados indicaron que la imputación de datos basada en el algoritmo de bosque aleatorio superó a los árboles de clasificación y regresión, el vecino más cercano, y otros enfoques convencionales (la prueba de rango con signo de Wilcoxon y la diferencia de correlación tienen un valor de < 0.001-0.030). Luego utilizamos datos rescatados basados en un sistema natural que involucra arañas cleptoparásitas de Taiwán y Vietnam (, Theridiidae) para probar la ocurrencia y el tamaño del grupo de cleptoparásitos en poblaciones naturales. Nuestros resultados de modelado de trayectoria de mínimos cuadrados parciales (PLS-PM) demostraron que el tamaño de la telaraña hospedadora ( = 6.890, = 0.000) es una característica significativa que afecta el tamaño del grupo. El tamaño del recurso ( = 2.590, = 0.010) y el microclima ( = 3.230, = 0.001) son características significativas que afectan la presencia de cleptoparásitos. La prueba de conformación de la distribución del tamaño del grupo al modelo de distribución libre ideal (IFD) reveló que las predicciones relacionadas con el tamaño del recurso per cápita estaban subestimadas (pendientes medias de remuestreo bootstrap