Evaluando gráficos acíclicos dirigidos con DAGMetrics: ideas a partir de datos del microbioma del tubérculo y del suelo
Autores: Averin, Pavel; Mellidou, Ifigeneia; Ganopoulou, Maria; Xanthopoulou, Aliki; Moysiadis, Theodoros
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Evaluando gráficos acíclicos dirigidos con DAGMetrics: ideas a partir de datos del microbioma del tubérculo y del suelo
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Comprensión
Evaluación
Grafos acíclicos dirigidos
DAGs
Descubrimiento causal
Conjuntos de datos de alta dimensionalidad
Pequeñas muestras
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Comprender y evaluar los grafos acíclicos dirigidos (DAGs) es crucial para el descubrimiento causal, especialmente en conjuntos de datos de alta dimensionalidad y pequeño tamaño, como los datos de abundancia microbiana. Este estudio presenta DAGMetrics, un paquete de R diseñado para evaluar y comparar exhaustivamente los DAGs. El paquete proporciona métricas descriptivas y comparativas, agilizando la evaluación de los resultados de varios algoritmos de aprendizaje de estructuras. Se aplicó a conjuntos de datos generados para tubérculos de patata y suelos de diferentes terroirs (continental e isleño) y etapas (en la cosecha y post-cosecha). Utilizando un conjunto completo de métricas descriptivas y comparativas, DAGMetrics facilitó la selección de modelos al identificar DAGs equilibrados y robustos. El algoritmo PC con correlación de Spearman produjo DAGs con una complejidad moderada y una alta estabilidad en diferentes configuraciones de escalado y transformación. Además, el paquete permitió una exploración detallada del espacio de la manta de Markov, revelando mantas de Markov pequeñas (hasta siete nodos) y numerosos nodos aislados. La identificación de bordes coincidentes entre mantas de Markov en diferentes terroirs y etapas se alineó con interacciones microbianas conocidas, resaltando la utilidad del paquete para facilitar el descubrimiento de relaciones biológicamente significativas. Este estudio ilustra la utilidad de DAGMetrics al proporcionar herramientas objetivas y reproducibles para la evaluación de DAGs junto con su posible aplicación en ámbitos agronómicos y otros que involucren datos estructurados complejos.
Descripción
Comprender y evaluar los grafos acíclicos dirigidos (DAGs) es crucial para el descubrimiento causal, especialmente en conjuntos de datos de alta dimensionalidad y pequeño tamaño, como los datos de abundancia microbiana. Este estudio presenta DAGMetrics, un paquete de R diseñado para evaluar y comparar exhaustivamente los DAGs. El paquete proporciona métricas descriptivas y comparativas, agilizando la evaluación de los resultados de varios algoritmos de aprendizaje de estructuras. Se aplicó a conjuntos de datos generados para tubérculos de patata y suelos de diferentes terroirs (continental e isleño) y etapas (en la cosecha y post-cosecha). Utilizando un conjunto completo de métricas descriptivas y comparativas, DAGMetrics facilitó la selección de modelos al identificar DAGs equilibrados y robustos. El algoritmo PC con correlación de Spearman produjo DAGs con una complejidad moderada y una alta estabilidad en diferentes configuraciones de escalado y transformación. Además, el paquete permitió una exploración detallada del espacio de la manta de Markov, revelando mantas de Markov pequeñas (hasta siete nodos) y numerosos nodos aislados. La identificación de bordes coincidentes entre mantas de Markov en diferentes terroirs y etapas se alineó con interacciones microbianas conocidas, resaltando la utilidad del paquete para facilitar el descubrimiento de relaciones biológicamente significativas. Este estudio ilustra la utilidad de DAGMetrics al proporcionar herramientas objetivas y reproducibles para la evaluación de DAGs junto con su posible aplicación en ámbitos agronómicos y otros que involucren datos estructurados complejos.