如何从纷繁复杂的数据中发现其中隐含因果关系,就是因果关系发现(casual discovery)要做的工作。本节简要总结这方面的工作,主要材料来源于《Elements of Causal Inference Foundations and Learning Algorithms》[1]这本书第4章、第7章和一些综述文章[2][3]。
在学习因果关系发现之前,首先补充一些相关的概念定义。
这些定义都是参考知乎作者:木土老师《因果关系》https://zhuanlan.zhihu.com/p/555170435
马尔可夫性(Markov property)是构成图模型基础的一个常用假设。当一个分布关于一个图是“马尔可夫”(Markovian)的,则表明这个图能够建模分布中的某些特定的独立性,那么我们就可以利用这些独立性来进行有效的计算或进行数据存储。有向图和无向图都存在马尔可夫性,但在因果推理中,主要还是研究有向图的马尔可夫性。
【定义】 马尔可夫性:给定一个有向无环图 G 以及所有节点的联合概率分布 P ,那么如果 Xi 和 Xj被 S d分离⇒Xi⊥⊥Xj|S ,则称这个分布 P 满足关于G 的全局马尔可夫性。
与之相对偶的性质是忠实性(Faithfulness)。
【定义】 忠实性:考虑一个分布 P 和一个有向无环图 G ,那么如果 Xi⊥⊥Xj|S⇒ Xi 和 Xj被 S d分离 ,那么 P 关于 G 就是忠实的。
考虑如下的一个例子。假设概率分布 P 对有向无环图 G 是马尔可夫且忠实的,那么根据以下条件确定模型 G 的结构。
图1
三种条件下的答案如图1所示。第1个条件的情形是唯一的对撞结合,也就是V结构。根据之前学习的知识,对撞结合让 X 和 Z 独立,当以 Y 为条件时, X 和 Z 变为相关。第2个条件符合的结合不止一种。这三种结构被称为马尔可夫等价类(Markov Equivalence class)。
【定义】马尔可夫等价类:如果有向无环图 G 和 H 具有相同的d分离特性,那么 G 和 H 就是马尔可夫等价的,并且同属于一个马尔可夫等价类。如果 G 和 H 是马尔可夫等价的,那么它们具有相同的骨架(Skeleton)和V结构(也即对撞结构),反之亦然。
骨架的意思可以理解为不考虑箭头方向的连接结构。图1(i)和(ii)的四个图都共有相同的骨架。图1(ii)的三个图不仅具有相同的骨架,还具有相同的V结构(因