论文记录-因果框架对比

因果框架对比分析

Rubin因果框架——潜在结果模型

  1. 针对的场景是:统计学中的因果关系分析
  2. 三大假设:
    1. 潜在结果:针对每个单元的每种干预都有一种潜在结果,且实际情况下只能观察到一种潜在结果
    2. 稳定性假设:不同个体的潜在结果之间不会有交互影响,干预水平对所有个体都是相同的
    3. 分配机制:是决定哪些个体得到处理,从而哪些潜在结果可以被观察到的过程。正式地来说,分配机制是协变量、潜在结果和分配向量的函数,表示在特定协变量和潜在结果下,某一分配向量实现的概率。
  3. 基本问题:所有潜在结果不可能同时被观测到,由此导致因果推断中的数据缺失问题
  4. 解决方法:Rubin(1974)认为这一问题实质上就是一个缺失数据的问题。因此要进行因果分析,就需要把缺失的潜在结果填补上。一些个体的背景特征(协变量)往往能够帮助我们进行缺失潜在结果的预测。
  5. 总的来说是基于协变量进行反事实推断,从而估计因果关系。

Pearl因果框架——结构因果模型

  1. 研究的问题是如何从已有的数据中学习表征因果关系的贝叶斯网络
  2. 用数学语言描述就是判断变量是否条件独立

区别与联系

目的都是为了计算存在混淆变量时,干预变量时对结果的影响,都需要对因果关系作假设,以及控制带来偏差的变量

不同点在于:

  1. Rubin框架估计的因果效应主要是干预前后的期望差值
  2. 而Pearl框架下,我们估计的是干预前后的分布差异
  3. Rubin框架解决的问题是因果效应的估计和统计推断
  4. Pearl框架更偏向于因果关系的识别

Rubin 的观点

我曾经在哈佛大学帮助组织过一次会议,我们邀请了Don Rubin和Tyler Vanderweele(DAGs的支持者)就因果推断的图形方法的优点进行了演讲。我们有来自文理研究生院统计系的学生(一般是站在Rubin一边)和来自公共卫生学院流行病学和生物统计系的学生(由于Jamie Robins的影响,公共卫生学院的统计系有大量的图形化研究)。这次会议的部分目的是帮助我们了解对方的想法,并澄清我们真正的分歧所在。

由于我是一名流行病学家,而不是统计学家,鲁宾的一些论点可能超出了我的想象。然而,我的主要收获是,Rubin非常相信 “没有操纵就没有因果关系 “的论断,也就是说,把不可操纵的变量说成是什么原因是没有意义的。我的理解是,他不喜欢DAGs,因为这些图隐含地将混杂物标记为暴露和结果的 “原因”,违反了这一哲学。

以下是对这两种因果推断方法之间差异的主要简化。

Pearl和Rubin都提供了框架,用于陈述关于数据如何产生的假设,并使用这些假设来证明一个观察量将等于因果效应。这些框架都是有效的,因为如果假设(非封闭性)是真的,那么结论(因果效应的识别)也就随之而来。

在Pearl的框架中,调查者从一个假设出发,即数据是由一个特定的有向无环图产生的,然后证明如果他能够通过对某些协变量进行调节来阻止暴露和结果之间的所有后门路径,那么控制这些变量就足以消除混杂。

在Rubin的框架中,调查者从假设治疗是由 “治疗分配机制 “分配的开始,然后证明,如果以某些协变量为条件,这个机制不取决于反事实结果,那么控制这些协变量就足以消除混杂。

Pearl声称这些方法是等同的。从Pearl对混杂的定义到Rubin的定义,其逻辑含义似乎没有争议。我不确定你到底要做什么背景假设(如果有的话)才能使反面的说法成立,但我认为这些假设并不具有限制性。

这两种方法在逻辑上都是有效的。然而,有无限多的可能的假设,你可以作为你的推理链的起点来证明识别。因此,真正的问题是,任何一个框架是否允许你从一个基础开始推理,以利于清楚地交流关于鉴定所需的假设对某项研究来说是否真实。

这就是我认为Pearl的优势所在。他的DAGs确实经过了优化,允许科学家准确地澄清他们认为数据是如何产生的,并以透明的形式呈现这些假设,以便其他科学家可以对其进行评估、讨论和批评。我认为,如果只使用反事实变量和治疗分配机制的语言来进行这样的对话,将是非常具有挑战性的。

我认为,Pearl的框架更适合作为我们进行关于控制哪些变量的讨论的语言的目的。我相信图形语言的使用者将能更好地传达一些微妙的观点,这些观点将影响分析方法的选择和估计的可信度。由于这是观察性研究中不确定性的主要来源,我相信DAGs最终会在思想市场上胜出。

一些英文资料的总结

鲁宾模型的重点是潜在的结果,以及单位在不同的条件下(最常见的是有和没有二元处理)如何有潜在的结果。例如,Y(1)是治疗1下的潜在结果数组,Y(0)是治疗0下的潜在结果数组。这在考虑实验以及随机化如何实现一个单位的一个潜在结果时特别有用,该结果可以与其他单位结合起来,用于计算平均治疗效果(因为我们不能估计个人层面的因果效应)。为了解决因果推断的基本问题(我们只能在一个世界中观察一个单位),我们需要一台时间机器,在没有这种科幻工具的情况下,我们只能依靠分配机制对因果推断的重要性(来估计ATE、LATE、PATE、ATT、ATC和ITT等效应)。这个模型的关键优势之一是了解潜在的结果是如何变成一个实现的结果以及我们所依赖的假设。例如,稳定的单位处理价值假设(SUTVA)意味着一个单位的潜在结果不受另一个单位处理的影响。这就强调了尽量减少单位之间干扰的重要性。对Rubin模型最好的全面介绍是Imbens和Rubin(2015)。

Pearl模型通过有向图(DAG)提供了因果识别,也就是说,沿着一条路径对一个变量进行调节是如何阻断路径的,以及为了进行因果推断,需要对具体的效果进行限制。在使用这种因果关系模型时,你通常要处理多条路径,而不是只有两组、一个结果和一个处理的简单设置。DAGs也可以理解为非参数结构方程模型,在处理条件概率和贝叶斯网络/图形模型时特别有用。

Pearl模型的主要优点之一是,它迫使你更仔细地思考你的因果模型,包括不控制的内容。由于这个原因,该模型比鲁宾模型更适合于复杂环境下的因果推断。

然而,也有一些值得注意的限制。模型中隐含着交互作用和效应的异质性,要表达这样的想法可能很困难(而在Rubin模型中考虑条件平均治疗效应则比较容易)。虽然DAG对理解复杂的因果模型很有帮助,但当我们要考虑在实践中估计因果效应所需的参数化假设时,它的帮助往往就不大。

令人惊讶的是,对珍珠模式最好的介绍不是珍珠本人的作品(尽管我确实喜欢《为什么之书》)。作为一名政治科学家(或更普遍的社会科学家),我发现摩根和温希普(2014)、埃尔韦特(2013)、埃尔韦特和温希普(2014)、达布兰德(2020)和鲁尔(2018)等介绍更容易理解。

在政治学中,研究人员大多依赖鲁宾和坎贝尔的工作,而较少依赖珍珠的工作。然而,最近我们看到了一些依靠DAGs所提供的洞察力的好工作。很好的例子包括关于美国有种族偏见的警务工作(见Knox等人,2020)和关于估计受控直接效应的工作(Acharya等人,2016)。

Imbens(2020)对DAGs与Rubin模型的关系进行了很好的批判性讨论(赞成潜在的结果而不是DAGs作为社会科学内因果关系的首选模型)。Matthay和Glymour(2020)展示了对内部、外部、构造和统计结论有效性的威胁如何以DAG的形式呈现。Lundberg等人(2021年)展示了潜在结果和DAGs如何被用来概述连接理论估计和经验估计的识别假设。这是一项了不起的工作,每个对连接统计证据和理论的强因果推理感兴趣的人都应该读一读。

我的看法是,这三种模型可以很好地结合在一起,但在思考理论、研究设计和数据时不一定同时进行。具体来说,我更喜欢Pearl → Rubin → Campbell。首先,用Pearl来概述因果模型(特别关注不包括什么)。第二,用Rubin来关注感兴趣的因果估计,考虑不同的估计器和假设(SITA/SUTVA)。第三,用坎贝尔来讨论对真实性的威胁,测量误差等。

参考内容

  1. wiki
  2. Imbens & Rubin:因果分析的基本框架以及经典随机试验
  3. 因果推断(三): 潜在结果模型
  4. 到底 Judea Pearl 提出的 因果推理 和 贝叶斯网络 是什么,求深入浅出讲解? - 知乎
  5. 因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二)
  6. 因果推断笔记——自整理因果推断理论解读(七)
  7. 因果推断(causal inference)是回归(regression)问题的一种特例吗?
  8. Quora上的问答
  9. Causality models: Campbell, Rubin and Pearl
  10. 【综述长文】因果关系是什么?结构因果模型入门

此外:

  1. 因果科学与Causal AI读书会第二季
  2. 统一Pearl与Rubin的因果图模型:Single-World Intervention Graphs
  • Copyrights © 2020-2024 Kun Li

请我喝杯咖啡吧~

支付宝
微信