Algoritmos de inferencia causal basados en conocimientos previos y sus aplicaciones para el análisis de COVID-19 en China
Autores: Li, Haifeng; Hai, Mo; Tang, Wenxun
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmos de inferencia causal basados en conocimientos previos y sus aplicaciones para el análisis de COVID-19 en China
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Inferencia causal
Costo de computación
Precisión
Algoritmos
Redes bayesianas
Variables
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
La inferencia causal se ha convertido en una dirección importante de investigación en el campo de la computación. Los métodos tradicionales han utilizado principalmente redes bayesianas para descubrir los efectos causales entre variables. Estos métodos tienen limitaciones, a saber, por un lado, el costo computacional es caro si se desea lograr resultados precisos, es decir, un crecimiento exponencial junto con el número de variables. Por otro lado, la precisión no es lo suficientemente buena si se intenta reducir el costo computacional. En este estudio, utilizamos la iteración de conocimiento previo o el ajuste de tendencias de series temporales entre variables causales para resolver las limitaciones y descubrir bordes causales bidireccionales entre las variables. Posteriormente, obtenemos gráficos causales reales, estableciendo así un modelo causal más preciso para la evaluación y el cálculo de los efectos causales. Presentamos dos nuevos algoritmos, a saber, el algoritmo PC+ y el algoritmo DCM. El algoritmo PC+ se utiliza para abordar el problema del algoritmo PC tradicional, que necesita enumerar todas las clases de equivalencia de Markov a un alto costo computacional o con la salida inmediata de bordes causales no direccionales. En el algoritmo PC+, la tendencia causal entre algunas variables se analizó mediante un análisis exhaustivo parcial. Al fijar la causalidad relativamente cierta como conocimiento previo, se obtiene un gráfico causal de mayor precisión como resultado final a un bajo costo de ejecución. El algoritmo DCM utiliza la estrategia de d-separación para mejorar el algoritmo CCM tradicional, que solo puede manejar el ajuste de variables de a pares, e identificar así la causalidad indirecta como directa. Al utilizar la estrategia de d-separación, nuestro algoritmo DCM logra una mayor precisión siguiendo los criterios básicos de las redes bayesianas. En este estudio, evaluamos los algoritmos propuestos basados en la pandemia de COVID-19 con análisis experimental y teórico. Los resultados experimentales muestran que nuestros algoritmos mejorados son efectivos y eficientes. En comparación con el costo exponencial del algoritmo PC, la complejidad temporal del algoritmo PC+ se reduce a un nivel lineal. Además, las precisiones del algoritmo PC+ y del algoritmo DCM se mejoran en diferentes grados; específicamente, la precisión del algoritmo PC+ alcanza el 91%, mucho más alta que el 33% del algoritmo PC.
Descripción
La inferencia causal se ha convertido en una dirección importante de investigación en el campo de la computación. Los métodos tradicionales han utilizado principalmente redes bayesianas para descubrir los efectos causales entre variables. Estos métodos tienen limitaciones, a saber, por un lado, el costo computacional es caro si se desea lograr resultados precisos, es decir, un crecimiento exponencial junto con el número de variables. Por otro lado, la precisión no es lo suficientemente buena si se intenta reducir el costo computacional. En este estudio, utilizamos la iteración de conocimiento previo o el ajuste de tendencias de series temporales entre variables causales para resolver las limitaciones y descubrir bordes causales bidireccionales entre las variables. Posteriormente, obtenemos gráficos causales reales, estableciendo así un modelo causal más preciso para la evaluación y el cálculo de los efectos causales. Presentamos dos nuevos algoritmos, a saber, el algoritmo PC+ y el algoritmo DCM. El algoritmo PC+ se utiliza para abordar el problema del algoritmo PC tradicional, que necesita enumerar todas las clases de equivalencia de Markov a un alto costo computacional o con la salida inmediata de bordes causales no direccionales. En el algoritmo PC+, la tendencia causal entre algunas variables se analizó mediante un análisis exhaustivo parcial. Al fijar la causalidad relativamente cierta como conocimiento previo, se obtiene un gráfico causal de mayor precisión como resultado final a un bajo costo de ejecución. El algoritmo DCM utiliza la estrategia de d-separación para mejorar el algoritmo CCM tradicional, que solo puede manejar el ajuste de variables de a pares, e identificar así la causalidad indirecta como directa. Al utilizar la estrategia de d-separación, nuestro algoritmo DCM logra una mayor precisión siguiendo los criterios básicos de las redes bayesianas. En este estudio, evaluamos los algoritmos propuestos basados en la pandemia de COVID-19 con análisis experimental y teórico. Los resultados experimentales muestran que nuestros algoritmos mejorados son efectivos y eficientes. En comparación con el costo exponencial del algoritmo PC, la complejidad temporal del algoritmo PC+ se reduce a un nivel lineal. Además, las precisiones del algoritmo PC+ y del algoritmo DCM se mejoran en diferentes grados; específicamente, la precisión del algoritmo PC+ alcanza el 91%, mucho más alta que el 33% del algoritmo PC.