因果阶梯

Posted on 2023-04-08 In Inspiring , A.I. Views: Waline:

因果阶梯(Ladder of Causation)是由图灵奖得主、贝叶斯网络之父Judea Pearl所提出的因果层次结构(Pearl Causal Hierarchy, PCH)隐喻，在其著作《The Book of Why》(2018)及《Causality》(2000)中有较全面阐述。

在Pearl的因果阶梯理论中，因果推断被划分为三个层次：

关联P(y|x)（Association）：解答“X与Y存在怎样的关联性”？当前主流统计学所关注的内容，即通过数据确定变量间的相关性，对应于贝叶斯网络(及相关的深度学习)。但相关不等于因果，我们可通过数据确定鸡鸣和日出相关，但却不能得出日出导致鸡鸣的结论。不过基于相关已经可对未来做出有意义的预测和指导，这也是机器学习和深度学习被广泛应用的基础，但显然缺乏因果律的鲁棒性与普适性。
干预P(y|do(x))（Intervention）：解答“如果干预X，Y将受到什么影响”，比如吸烟是否会增加患癌的概率。在传统统计分析中并没有对应的数学语言，Pearl引入了do算子，通过do演算实现对干预分析的精确描述。相比单纯的统计关联，干预分析涉及到了因果关系，通常需要对照实验才能判断。
反事实P(y_x|x’, y’)（Counterfactuals）：在事件X’, Y’已发生的前提下，假设过去发生的不是X’而是X，判断Y发生的概率。粗略看跟干预很像，核心区别在于分析时要以事实（X’,Y’已发生）作为前提，因此是反事实推理。干预是面向未来的设想，可通过实验检验；而反事实则是面向过去的假设，以已发生的事实作为前提，是在反思原因的必要性(probability of necessity)。反事实是只存在于思维中的虚构推理，通常没有作为支撑的观测数据，也就难以基于统计分析推演。
比如感冒了，吃感冒药后，感冒好了，并不能因此断定感冒药就是病愈的原因，而需要反事实推理“如果当初没吃感冒药，现在感冒是不是就不会好”，即探讨感冒药对于病愈这一结果的必要性是多少。事实上，大部分情况下感冒都是会自愈的，常见的感冒药只是缓解症状，但同时病症因体质而异，缓解症状本身可能也是性命攸关的。

关联、干预和反事实分别解答What is the relation? What if I do X? What if I had done X? 更高层次的问题蕴含了低层次的问题。干预分析可直接由反事实推理得出，相关分析也可由干预实验解答。但反过来，数据中反映的相关性无法给出因果，也无法预言干预实验，而反事实推理通常也不能由简单的对照实验所替代。比如在案件定罪量刑时，通常需要判断受害者的现状有多大程度是被告者的行为所导致的，这就需要借助反事实推理，而且是无法用干预实验来替代的。

扩展阅读：
“无人问津”的贝叶斯网络之父Judea Pearl在NIPS 2017上到底报告了啥
 Judea Pearl提出的「因果阶梯」到底是什么？
Structural Causal Model(SCM)

基于统计的机器学习方法缺乏反事实这一层级的信息，无法进行反事实层面的推理，这是现有机器学习方法理论上的缺陷。不过ChatGPT强大的涌现能力，也让人好奇深度学习到底能不能突破现有框架的限制，做到第三阶段的反事实推理。
GPT的反事实推理能力尚待观察，不过 @curious_vii 尝试让 GPT-4 拓展 Pearl 的理论，得到的扩展乍看之下还算自洽：元因果推理（reflecting，反思）、社会性因果推理（collaborating，协作）、跨领域因果推理（generalizing，泛化）、演化因果推理（adapting，适应）、跨模态因果推理（synthesizing，综合）、有意识的因果推理（self-awareness，自我意识）。