Aprendizaje de características invariables basado en inferencia causal de entornos heterogéneos
Autores: Su, Hang; Wang, Wei
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aprendizaje de características invariables basado en inferencia causal de entornos heterogéneos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Causalidad
Características invariables
Método de inferencia causal
IFCI
Datos de alta dimensionalidad
Generalización OOD
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La causalidad se ha convertido en una herramienta poderosa para abordar el problema de generalización fuera de la distribución (OOD), con la idea de características causales invariantes en los dominios de interés. Los métodos existentes para aprender características invariantes se basan en la optimización, que suele no converger hacia la solución óptima. Por lo tanto, obtener las variables que causan el resultado objetivo a través de un método de inferencia causal es un método más directo y efectivo. Este artículo presenta un nuevo enfoque para el aprendizaje de características invariantes basado en la inferencia causal (IFCI). IFCI detecta variables causales no afectadas por el entorno a través del método de inferencia causal. IFCI se centra en relaciones causales parciales para trabajar eficientemente incluso frente a datos de alta dimensionalidad. Nuestro método de inferencia causal propuesto puede inferir con precisión los efectos causales incluso cuando la variable de tratamiento tiene valores más complejos. Nuestro método puede ser visto como un pretratamiento de datos para filtrar variables cuyas distribuciones cambian entre diferentes entornos, y luego puede combinarse con cualquier método de aprendizaje para clasificación y regresión. El resultado de estudios empíricos muestra que IFCI puede detectar y filtrar variables ambientales afectadas por el entorno. Después de filtrar variables ambientales, incluso un modelo con una estructura simple y una función de pérdida común puede tener una sólida capacidad de generalización OOD. Además, proporcionamos evidencia que muestra que los clasificadores que utilizan IFCI logran una mayor precisión en la clasificación en comparación con los algoritmos existentes de generalización OOD.
Descripción
La causalidad se ha convertido en una herramienta poderosa para abordar el problema de generalización fuera de la distribución (OOD), con la idea de características causales invariantes en los dominios de interés. Los métodos existentes para aprender características invariantes se basan en la optimización, que suele no converger hacia la solución óptima. Por lo tanto, obtener las variables que causan el resultado objetivo a través de un método de inferencia causal es un método más directo y efectivo. Este artículo presenta un nuevo enfoque para el aprendizaje de características invariantes basado en la inferencia causal (IFCI). IFCI detecta variables causales no afectadas por el entorno a través del método de inferencia causal. IFCI se centra en relaciones causales parciales para trabajar eficientemente incluso frente a datos de alta dimensionalidad. Nuestro método de inferencia causal propuesto puede inferir con precisión los efectos causales incluso cuando la variable de tratamiento tiene valores más complejos. Nuestro método puede ser visto como un pretratamiento de datos para filtrar variables cuyas distribuciones cambian entre diferentes entornos, y luego puede combinarse con cualquier método de aprendizaje para clasificación y regresión. El resultado de estudios empíricos muestra que IFCI puede detectar y filtrar variables ambientales afectadas por el entorno. Después de filtrar variables ambientales, incluso un modelo con una estructura simple y una función de pérdida común puede tener una sólida capacidad de generalización OOD. Además, proporcionamos evidencia que muestra que los clasificadores que utilizan IFCI logran una mayor precisión en la clasificación en comparación con los algoritmos existentes de generalización OOD.