因果阶梯

因果阶梯(Ladder of Causation)是由图灵奖得主、贝叶斯网络之父Judea Pearl所提出的因果层次结构(Pearl Causal Hierarchy, PCH)隐喻,在其著作《The Book of Why》(2018)及《Causality》(2000)中有较全面阐述。

在Pearl的因果阶梯理论中,因果推断被划分为三个层次:

  • 关联P(y|x)(Association):解答“X与Y存在怎样的关联性”?当前主流统计学所关注的内容,即通过数据确定变量间的相关性,对应于贝叶斯网络(及相关的深度学习)。但相关不等于因果,我们可通过数据确定鸡鸣和日出相关,但却不能得出日出导致鸡鸣的结论。不过基于相关已经可对未来做出有意义的预测和指导,这也是机器学习和深度学习被广泛应用的基础,但显然缺乏因果律的鲁棒性与普适性。
  • 干预P(y|do(x))(Intervention):解答“如果干预X,Y将受到什么影响”,比如吸烟是否会增加患癌的概率。在传统统计分析中并没有对应的数学语言,Pearl引入了do算子,通过do演算实现对干预分析的精确描述。相比单纯的统计关联,干预分析涉及到了因果关系,通常需要对照实验才能判断。
  • 反事实P(yx|x’, y’)(Counterfactuals):在事件X’, Y’已发生的前提下,假设过去发生的不是X’而是X,判断Y发生的概率。粗略看跟干预很像,核心区别在于分析时要以事实(X’,Y’已发生)作为前提,因此是反事实推理。干预是面向未来的设想,可通过实验检验;而反事实则是面向过去的假设,以已发生的事实作为前提,是在反思原因的必要性(probability of necessity)。反事实是只存在于思维中的虚构推理,通常没有作为支撑的观测数据,也就难以基于统计分析推演。
    比如感冒了,吃感冒药后,感冒好了,并不能因此断定感冒药就是病愈的原因,而需要反事实推理“如果当初没吃感冒药,现在感冒是不是就不会好”,即探讨感冒药对于病愈这一结果的必要性是多少。事实上,大部分情况下感冒都是会自愈的,常见的感冒药只是缓解症状,但同时病症因体质而异,缓解症状本身可能也是性命攸关的。

关联、干预和反事实分别解答What is the relation? What if I do X? What if I had done X? 更高层次的问题蕴含了低层次的问题。干预分析可直接由反事实推理得出,相关分析也可由干预实验解答。但反过来,数据中反映的相关性无法给出因果,也无法预言干预实验,而反事实推理通常也不能由简单的对照实验所替代。比如在案件定罪量刑时,通常需要判断受害者的现状有多大程度是被告者的行为所导致的,这就需要借助反事实推理,而且是无法用干预实验来替代的。

扩展阅读:
“无人问津”的贝叶斯网络之父Judea Pearl在NIPS 2017上到底报告了啥
Judea Pearl提出的「因果阶梯」到底是什么?
Structural Causal Model(SCM)


基于统计的机器学习方法缺乏反事实这一层级的信息,无法进行反事实层面的推理,这是现有机器学习方法理论上的缺陷。不过ChatGPT强大的涌现能力,也让人好奇深度学习到底能不能突破现有框架的限制,做到第三阶段的反事实推理。
GPT的反事实推理能力尚待观察,不过 @curious_vii 尝试让 GPT-4 拓展 Pearl 的理论,得到的扩展乍看之下还算自洽:元因果推理(reflecting,反思)、社会性因果推理(collaborating,协作)、跨领域因果推理(generalizing,泛化)、演化因果推理(adapting,适应)、跨模态因果推理(synthesizing,综合)、有意识的因果推理(self-awareness,自我意识)。