猿创征文｜基于反事实的因果推理Causal inference based on counterfactuals--一万六千字文献详细解读（因果关系的推理应用）【全文总结】

发布时间：2024-08-13 10:01

前言：

在研0的这个暑假当中，这篇文章也是对自己近两个月以来的部分学习做了一个ending!!在这段生活当中，经历了难受，经历了迷茫找不到一个属于自己的学习方法。写下这篇文章解读也对自己近段时间做了一个总结，也希望在以后的研究生生活当中能够坚持下去！保持现在对自己的严格标准！！保持自己的不服输，不甘心！！也希望这篇文章能够一直激励自己---“靡不有初，鲜克有终！”

文章框架：

一、研究背景意义：

①在流行病学和医学研究中，反事实或潜在结果模型已日益成为因果推断的标准。

②反事实是医学和流行病学中因果推断的基础。

③困难：观察性研究当中，对于反事实差异的估计有一定困难。

④对个体产生因果效应的唯一必要条件是该因素对其影响的优先性。

⑤100%的因果关系证据是不可能的。

⑥问题：人们在实践中可以收集多少因果效应的证据，以及什么统计模型可以为这些证据做出贡献。

⑦作者观点：认为因果效应的反事实模型抓住了健康科学中因果关系的大部分方面。

二、文章中运用到的公式及其符号：

① Xi = t 被治疗

Xi =c 没有治疗

Yi,t 被治疗的结果

Yi,c 未治疗的结果

②

:表示个体i的治疗水平t与治疗水平c之间存在因果关系

：表示不同处理之间影响的大小---两种治疗水平之间结果的差异

③

：表示不再有其他症状，类似于治疗成功

：表示患有的疾病继续存在

④

：可估计表示平均因果效应，前提是X=c和X=t的个体是“可交换的”

⑤

:对超加性风险差异的表示---（X=1和Z=1）的影响高于(X=1和Z=0)和(X=0和Z=1)的影响之和再减（X=0和Z=0）的影响

⑥

：表示倾向评分--倾向评分是个体i被分配到治疗t的概率——在发生组分配到X=c或X=t时，用PSi=P表示（Xi=t）

⑦

:表示54岁死于癌症

⑧

：

RF:表示归因分数即由于暴露导致的超额发病率--相对于暴露后的发病率

IRX = 0 ：暴露的目标人群的发病率

IRX=1 ：未暴露目标人群的发病率

⑨

：（也证明了RF与PC不同）

EF：被定义为暴露者中患有该疾病的比例。

C1暴露后导致疾病加速发作的个体数量

C2暴露导致发病的人数

CT暴露的总人数

⑩

：表示暴露对于暴露者产生的影响概率很低，则归因分数≈A2/AT，也被称为超额率

三、对文章的详细剖析：

第一部分：

在文章的摘要方面，大致介绍了文章写作背景、分哪些因素进行讨论、可能遇到的一些困难等

①写作背景：在流行病学和医学研究中，反事实或潜在结果模型已日益成为因果推断的标准。

②估计因果效应时的影响因素：因果相互作用、不完善的实验、混杂因素的调整、随时间变化的暴露、竞争风险和因果关系的概率。

③可能遇到的困难:反事实是医学和流行病学中因果推断的基础；在观察性研究当中估计反事实差异有一些困难，并没有使反事实的本质失效

④文章观点:反事实模型因果效应的模型抓住了健康科学中因果关系的主要方面

第二部分：

1、在文章的背景方面，首先提出了几个重要的概念以及文章作者的观点：

①个体因果效应的唯一必要条件是因素优先于其效应

②100% 的因果关系证据是不可能的

③问题是在实践中可以收集多少因果效应的证据，以及哪些统计模型可以为这些证据做出贡献

④作者观点：认为因果效应的反事实模型涵盖了健康科学中因果关系的大部分方面

2、对该部分进行详细讲述：

首先提出几乎每个实证研究问题都是因果关系通过医学和流行病学研究的科学家们调查的问题---“哪些因素导致某种疾病？”或者“某种疗法如何影响疾病的持续时间和病程？”等问题引出---不是每一个关联都是暂时性的，也不是每一个暂时性的关联都涉及到因果关系，但也可能是有因果关系的。牵涉到因果成分，可能是计量误差、共同的先验因素或其他偏见造成的偏差所致的结论。（康德的“先验”是什么意思：先验意即在经验之前。我们大部分的知识都来源于「经验」，我们在认识事物的时候，总要看一下，摸一下，闻一下，或者你也可以称其为「实验」，但是康德认为有一些东西是存在于经验之前的，这些东西的属性我们可以叫做「先验性」。）

随后概要讲述了有关因果关系在哲学领域中的争论历史，随之讲述了作者自己的观点--认为因果效应的反事实模型涵盖了健康科学中因果关系的大部分方面阐述了文章所要详细讲述的问题和文章的模块--“在讨论部分的前两节，定义了因果效应的反事实模型，并讨论了统计推断的一些一般问题。接下来的几章概述了随机和非随机研究中的因果交互作用和因果推断。在最后两节中，回顾了几个特殊的主题和相关的方法来评估因果效应。”

第三部分（Discussion）：

一、因果效应的反事实模型

1、因果效应的反事实模型：文章该部分的讨论方面提出了一些结论和定义以及方法的推荐

①除非因素X和结果Y是可测量的量，否则统计学不能对因果推断作出贡献

②temporal direction可以通过大量的知识来进行确定，但大量知识可能不确定甚至错误

③因果顺序理想地由在测量结果之前已经操纵的实验中的条件来保证

④最好从前瞻性设计中推断temporal direction

⑤在非实验研究中，测量误差不仅可能发生在X和Y上，而且可能发生在temporal direction的评估上

⑥个体因果效应

2、对该部分进行详细讲述：

首先讲述了想要统计数据对因果推断做出贡献的前提条件--因素X和结果Y是可测量的量，

接着通过例子“性别可能影响人的食欲”说明了暂时性的一些影响因素可以通过大量的知识去评估，但大量知识可能不确定甚至错误的想法。

如果进行实验是可行的话对因和果的顺序保证条件——由在测量结果之前已经操纵的实验中的条件来保证，如果实验是不可行的通过例子“基线评估时报告的创伤事件作为随访期间偶发抑郁症的潜在风险因素”--（简单点说就是创伤事件可能作为偶发抑郁症的风险因素）--得出最好从前瞻性设计中推断这种暂时性的关联（temporal direction）而不是在横断面研究中回顾性收集暂时性关联（temporal direction）的信息。

（横断面研究(cross-sectional study)是通过对特定时点和特定范围内人群中的疾病或健康状况和有关因素的分布状况的资料收集、描述，从而为进一步的研究提供病因线索。它是描述流行病学中应用最为广泛的方法。）

（前瞻性设计：旨在从前瞻视角出发，思辨性地跳脱固有僵化观念的束缚，展望未来场景的可能；并以此反思当今社会的问题，先验创新或防微杜渐。）

在非实验研究中，测量误差不仅可能发生在X和Y上，而且可能发生在暂时性的关联（temporal direction）的评估上。

最后通过假设对个体i的因果效应进行了说明--假设我们想要评估指数治疗或暴露水平t（例如，服用特定药物）与另一治疗或暴露程度c（例如，未治疗）对结果Yi的影响，根据Greenland and Brumback ，我们在反事实推理中基本上假设：

①在指定的固定时间点，可以将个体i分配到两个治疗水平（Xi=t或Xi=c）

②结果Yi在Xi=t（用Yi，t表示）和Xi=c（用Yi，c表示）下都存在--(即两种结果都存在)

什么是反事实或者潜在结果？

（2）反事实和潜在结果

1、反事实和潜在结果：文章的该部分首先对上一部分的假设进行了分析，进而在上述假设的前提上解释了什么是反事实治疗?什么是反事实和潜在结果？也说明了有些因素不能作为反事实因果关系进行验证；也通过哲学的范畴论证了反事实的内容

①:没有接受的治疗称为反事实治疗。同样，这种治疗的结果被称为反事实或潜在结果

②：“潜在结果”一词反映了治疗任务前的观点，在统计学中更为广泛

③：有意义的反事实构成了个人i在固定分配时间的主要可能条件

④：当人类处理“如果”问题时，反事实思考似乎在创造力中起着至关重要的作用

2、对该部分进行详细讲述：
首先对上一部分的假设进行了阐述：如果个体i被分配到治疗水平t，则Yi,c是不可观察的；同样，如果个体i被分配到治疗水平c，则Yi,t是不可观察的。进而得出反事实或潜在结果的定义：没有接受的治疗称为反事实治疗。同样，这种治疗的结果被称为反事实或潜在结果。

---对于“潜在结果”反映了治疗分配前的观点，反事实结果表示治疗分配后的观点。

通过例子“对于男性来说，患有某种妇科疾病，而不是没有这种疾病，将是一种奇怪的反事实情况”得出了有意义的反事实构成了个人i在固定分配时间的主要可能条件的结论。也进而说明了在大多数情况下，性别、种族、年龄或基因型等内在变量的“影响”无法通过反事实因果关系进行检验。最后说明了反事实的重要性：当人类处理“如果”问题时，反事实思考似乎在创造力中起着至关重要的作用

（3）因果效应的定义

1、因果效应的定义：文章的该部分首先说明了怎么样才存在因果关系？如何定义产生影响的大小？也说明了因果效应衡量标准选择的重要性以及二元结果的反事实因果效应的定义

①：如果两种情况下的结果不同，则在分配治疗时，个体i的治疗水平t与治疗水平c之间存在因果关系

②：治疗水平之间的结果差异可以衡量因果效应影响的大小

③：衡量标准的选择影响了个体效应汇总作为总体平均效应的可解释性，以及个体效应的异质性作为因果相互作用的可理解性

④：二元结果中的因果效应是相互存在的，不会单独而存在

2、对该部分进行详细讲述：
首先解释如何证明存在因果关系：如果两种情况下的结果不同，则在分配治疗时，个体i的治疗水平t与治疗水平c之间存在因果关系，接着治疗水平之间的结果差异可以衡量因果效应影响的大小。通过衡量标准的选择说明了因果效应衡量标准选择的重要性：衡量标准的选择影响了个体效应汇总作为总体平均效应的可解释性，以及个体效应的异质性作为因果相互作用的可理解性（异质性(Heterogeneity)是指⼀些事物在某些特征上存在差异。在Meta分析中，异质性指纳⼊的不同研究之间存在的差异。异质性是遗传学概念，⼀种遗传性状可以由多个不同的遗传物质改变所引起。）

随后提出了“二元结果中的因果效应”的概念，通过假设--我有一个人患有某种特定的疾病。在接受某种治疗（Xi=t）后，患者不再有任何疾病症状（Yi,t=0）。问题是，与另一个治疗水平（例如,Xi=c:“未治疗”）相比，该治疗是否是疾病缓解的原因。---简单点说明，在反事实的概念当中，这个问题等同于如果同时将比较治疗水平c分配给同一个人i，疾病是否会持续，也就是说，Yi，c=1。借用David Hume的话点明了二元结果中的因果效应是相互存在的，不会单独而存在这个结论。

（4）选择参考治疗方法

1、选择参考治疗方法：该部分就是简单的介绍了评估反事实因果效应的第一个困难，分析对比了药物对照实验和安慰剂对照实验的利弊

①比较一个治疗水平t和另一个治疗标准c时选择参考条件，即“治疗标准c”的实质含义

②安慰剂对照实验:药物vs安慰剂

③药物对照实验:药物vs新药物

2、对该部分进行详细讲述：
首先直接说明了评估反事实因果效应的第一个困难：在比较一个治疗水平t和另一个治疗标准c时选择参考条件，即“治疗标准c”的实质含义。随后又阐述了该问题，研究人员可以通过指数治疗的效果将根据什么样的替代条件进行评估进而解决这个问题。

通过举例说明了如何去解决这个问题：例如，在药物治疗试验中，药物治疗的效果通常与安慰剂治疗（安慰剂对照试验）的效果进行对比，因为在大多数情况下，由患者接受治疗的印象产生的效果不是相关的效果。另一方面，如果一种药物已经显示出积极的效果，用这种药物治疗可以用来比较新药的疗效（药物对照试验）---两种实验的效果在理想状态下是不同的。

（5）多重因果因素和因果机制

1、多重因果因素和因果机制：该部分通过例证和图表说明了有关因果机制和因果因素的相关结论

①在反事实模型中，因果因素是一个必要的因素，没有它，结果（如治疗成功）就不会发生

②因果效应不一定是直接效应

③影响的机制与影响修正和中介变量密切相关

④由于不要求条件对结果是充分的，因此允许存在多个因果因素

2、对该部分进行详细讲述：
文章该部分通过与大多数身体疾病和几乎所有精神疾病的病因是多原因的事实一致的例子对结论由于不要求条件对结果是充分的，因此允许存在多个因果因素；在反事实模型中，因果因素是一个必要的因素，没有它，结果（如治疗成功）就不会发生加强了论证。

随后通过医学中医生和患者治疗之间的关系，充分说明了因果效应不一定是直接效应，通过触发一系列连续事件（生物、生化、心理或社会起源）而导致结果，而这些事件反过来又会影响结果（直接或间接）引出了图1：X通过对Z产生影响进而作用于Y；最后引出了影响的机制与影响修正和中介变量密切相关的结论PS：【调查因果关系并不需要了解其机制。然而，解释关联的能力往往支持其具有因果成分的结论】（这个结论简单点来说就是：

调节剂或者说是中介：

①不受×与丫影响（相对独立又不是完全独立）

②与x对丫的影响效果有关

③受x影响进而产生对丫的影响

二、反事实的统计推断

1、反事实效应的统计推断：通过法医弹道学中的人体模型例子简单证明了该部分的观点以及解决办法引出了平均因果效应

①不存在客观标准来评估单次观察结果

②平均因果效应：需要多次观察，涉及不同的个体或不同的时间点或两者兼而有之。统计上稳定的结论也需要许多观察

2、对该部分进行详细讲述：

该部分通过“法医弹道学中的人体模型”---证明子弹来自一支特定的枪，并在一名死者身上被发现但是不能证明是由于中弹而导致死亡，因为该人可能在子弹射出的那一刻死于突发冠状动脉衰竭，但这种可能性可以通过尸检来证实。举例论证了不存在客观标准来评估单次观察结果，如治疗成功（Yi，t=1）是否是由接受的治疗或其他因素引起的的结论。

进而引出了在缺少这种证实标准的情况下，我们可以通过平均因果效应来评估---平均因果效应：需要多次观察，涉及不同的个体或不同的时间点或两者兼而有之。统计上稳定的结论也需要许多观察

（2）平均因果效应

1、平均因果效应：首先对平均因果效应做出了解释，对要解释为总体平均效应的估计给出了公式上的标准

①平均因果效应，即目标人群中个体因果效应的平均值

②不同偏差的存在和大小取决于目标人群的选择

③要解释为总体平均效应的估计，X=t与X=c的算术平均值之间的差异（各治疗组中所有个体的汇总）必须等于个体水平差异的算术平均数

④随着越来越多的人（在一种或两种情况下）面临结果高风险，汇总优势比的总体平均解释变得越来越错误

2、对该部分进行详细讲述：

文章该部分，首先对平均因果效应做出了解释：平均因果效应，即目标人群中个体因果效应的平均值（目标群体：包括要对其进行推断的所有个体，而实际采样的群体是源群体---理想情况下，源群体等于目标群体，个体从该群体中随机抽样）如果样本来自目标人群以外的其他人群或者源人群中的平均因果效应与目标人群中的不同，则会出现选择偏差。进而引出不同偏差的存在和大小取决于目标人群的选择的结论。

对如果解释为总体平均效应的估计前提做出了公式（必要条件）：X=t与X=c的算术平均值之间的差异（各治疗组中所有个体的汇总）必须等于个体水平差异的算术平均数；在次基础上又对汇总和总体平均做出了评价：随着越来越多的人（在一种或两种情况下）面临结果高风险，汇总优势比的总体平均解释变得越来越错误。

以下讨论仅限于由不同个体而不是不同时间点（或两者）组成的样本的更常见情况---这就现实的一般情况（简单来说就是不同个体在同一时间点之间进行比较或者同一个体在不同时间点进行比较。）

（3）稳定个体的治疗假设

1、稳定个体的治疗假设:首先对稳定单元处理假设做出了说明和解释，最后对因果效应的估计做出了进一步的理解

①：假设个人I的结果独立于其他个人的结果及其接受的治疗水平。这被称为稳定单元处理假设

②：统计角度来看，因果效应的估计可以被视为缺失值的特定问题

2、对该部分进行详细讲述：

文章该部分首先对人群中每个个体的治疗分配结果进行了描述：在分配治疗前，人群中每个个体i都有两个随机变量：治疗c下的结果（Yi，c）和治疗t下的结果--为了简单和方便实验：我现在假设个人I的结果独立于其他个人的结果及其接受的治疗水平。这被称为稳定单元处理假设（它不适用于传染病作为结果。流感是一种特定个体的免疫可能影响其他个体的疾病（称为“群体效应”）

在治疗分配和结果观察之后，对于一个群体来说，每个个体只能包含一种实现结果。故统计角度来看，因果效应的估计可以被视为缺失值的特定问题。

（4）可交换性

1、可交换性：对简单的平均因果效应的估计做出了表示，给出了可以直接估计平均因果效应的必要条件，对其必要条件-可交换性的两个满足条件给出了详细的阐明。

①：最简单的估计方法是两个样本平均值之间的差异

②：如果具有X=c和X=t的个体是“可交换的”，则可以直接估计平均因果效应，因为分配没有偏差

③:对于Yt，接受治疗t的个体是接受治疗c的个体的替代品。

对于Yc，接受治疗c的个体是接受治疗t的个体的替代品。

2、对该部分进行详细讲述：

文章该部分首先做出假设：假设平均因果效应被定义为两个条件X=t和X=c之间目标群体的平均值差异故平均因果效应最简单的估计方法是两个样本平均值之间的差异。又给出了直接估计平均因果效应的必要条件：如果具有X=c和X=t的个体是“可交换的”，则可以直接估计平均因果效应，因为分配没有偏差（理想情况，现实中还是存在一定偏差）。

对可交换性做出了诠释：对于Yt，接受治疗t的个体是接受治疗c的个体的替代品。对于Yc，接受治疗c的个体是接受治疗t的个体的替代品。Ps:统计方法有助于实现因果效应的无偏估计。

一、因果效应的异质性

1、因果效应的异质性：一个重要的问题是评估个体之间因果效应的差异，因子Z作为X对Y影响的修正因子的必要条件是Z先于结果Y，效应修正因子通常用回归模型中的相互作用项进行评估（如果这种潜在影响修正因子Z与X相关，则在不作进一步假设的情况下，无法确定描述X对Y的影响修正的参数）----[回归模型重要的基础或者方法就是回归分析，回归分析是研究一个变量（被解释变量）关于另一个（些）变量（解释变量）的具体依赖关系的计算方法和理论,是建模和分析数据的重要工具。在这里，我们使用曲线/线来拟合这些数据点，在这种方式下，从曲线或线到数据点的距离差异最小。]

（2）效果度量的选择

1、效果度量的选择：对效果度量的意义做出了阐述，对于风险差异也做出了说明通过例子来证明风险差异存在的实际作用，引出因果协同和超加性的概念。

①影响程度的不同取决于Z值的不同

②一些效应测量方法（如几率比）通常只用来量化因果效应的大小，而且认为方法它在个体之间是恒定的

③风险差异是唯一的衡量标准

④效果异质性与反事实效果方面的因果协同作用有逻辑上的联系

⑤超加性风险差异：其中X=1和Z=1的联合效应高于（X=1，Z=0）和（X=0，Z=1）的效应之和，而Y=1在（X=2，Z=2）下的风险

⑥如果存在超可加性，则可以证明X和Z之间在Y上一定存在因果协同作用，至少对某些个体而言是如此

⑦我们可以证明一种因果关系，而不是这种因果关系不存在

⑧因果协同意味着1）如果存在一个或两个因素，Yi=1；2）如果两个因素都不存在，Yi=0。

2、对该部分进行详细讲述：

首先文章该部分通过对因果效应影响程度的不同取决于Z值的不同，进而对测量方法进行说明：一些效应测量方法（如几率比）通常只用来量化因果效应的大小，而且认为方法它在个体之间是恒定的。引出风险差异是影响异质性在反事实影响方面与因果共同作用逻辑上联系的唯一度量。（异质性(Heterogeneity)是指⼀些事物在某些特征上存在差异。在Meta分析中，异质性指纳⼊的不同研究之间存在的差异。异质性是遗传学概念，⼀种遗传性状可以由多个不同的遗传物质改变所引起。）（风险差异（risk difference，RD）（也称为绝对风险缩减量absolute risk reduction，ARR）预防1例不良事件发生或得到1例有利结果需要治疗的病例数（number needed to treat，NNT））通过例子：第一Yi = 1出现在 Xi = 1 的所有情况下，而在其他情况下不出现；第二 Yi = 1 出现在 Zi = 1 的所有情况下，而在其他情况下不出现。对因果协同做出了解释：因果协同意味着1）如果存在一个或两个因素，Yi=1；2）如果两个因素都不存在，Yi=0。结合现代人们对超加性风险差异感兴趣引出公式 ---P(Y = 1 | X = 1, Z = 1) > P(Y = 1 | X = 1, Z = 0) + P(Y = 1 |X = 0, Z = 1) - P(Y = 1 | X = 0, Z = 0).如果存在超加性，可以证明 X 和 Z 在 Y 上一定存在因果协同作用如果某些个体之间存在因果协同作用，则可能不存在超加性。最后通过例子:”如果已知某种药物的摄入剂量会线性地影响某种激素的释放，那么在线性模型中，另一个因素与药物摄入的交互项就对应着生物交互作用的存在”说明了选择效应指数的另一个关键点：回归模型中的相互作用项是否对应于所谓的基于机制的（如生物）相互作用。

（三）确定性与概率因果关系

1、确定性与概率因果关系：接着上文中的异质性开始展开，因果关系的功能决定论的理解，以及结果Y的准确性，该部分总体来说是对实验中的大部分差异因素做出了说明。

①因果效应异质性相关的一个基本问题是确定性因果关系和概率因果关系之间的区别

②因果关系的功能确定性理解基于拉普拉斯自然现象概念

③在没有测量误差和其他偏见的情况下，Y的可观察异质性--给定X和其他观察到的协变量--将完全归因于未观察到的因素

④结果Y中存在个体差异，这不能用未考虑的因素来解释。这种变化可以称为真实随机性

⑤在实际情况中，确定性因果关系和概率因果关系之间的区别在复杂到足以导致建模中存在大量剩余异质性的系统中并不起主要作用

⑥影响估计的差异并不意味着不同的因果机制起作用；相反，它们可能仅仅是由于隐藏效应修饰剂的不同分布

⑦非可操作属性几乎不受反事实参数的影响。

2、对该部分进行详细讲述：

文章该部分首先对因果效应异质性进行了详细说明：因果效应异质性相关的一个基本问题是确定性因果关系和概率因果关系之间的区别。接着引用了拉普拉斯自然观对因果关系的功能决定论做出了理解，（拉普拉斯:“我们可以把宇宙现在的状态视为其过去的果以及未来的因。如果一个智者能知道某一刻所有自然运动的力和所有自然构成的物件的位置,假如他也能够对这些数据进行分析,那宇宙里最大的物体到最小的粒子的运动都会包含在一条简单公式中。对于这智者来说,没有事物会是含糊的，而未来只会像过去般出现在他面前）；在没有测量误差和其他偏见的情况下，Y的可观察异质性--给定X和其他观察到的协变量--将完全归因于未观察到的因素（“协变量：在实验的设计中，协变量是⼀个独⽴变量（解释变量），不为

实验者所操纵，但仍影响实验结果。）之后对于实验中个体间无法区别的差别进行了特别说明：在因果关系的概率理解中，结果Y中存在个体差异，这不能用未考虑的因素来解释。这种变化可以称为真实随机性。进而我们也可以将真实随机性纳入反事实模型中来进行实验，指定固定个体在固定时间的潜在结果的概率分布。本段后部分也说明了即使我们不去做特意的说明和参数的施加：在实际情况中，确定性因果关系和概率因果关系之间的区别在复杂到足以导致建模中存在大量剩余异质性的系统中并不起主要作用。该部分的最后一段直接可以可以逆向理解为效应修正因子的存在，使人们期望相同的效果；影响估计的差异并不意味着不同的因果机制起作用；相反，它们可能仅仅是由于隐藏效应修饰剂的不同分布。对于个体的性别、种族和出生日期等不可变属性通常被视为模型范围狭窄的指标。综上所述，非可操作属性几乎不受反事实参数的影响。

（修正值定义为:⽤代数⽅法与未修正测量结果相加，以补偿其系统误差的值。

修正因⼦定义为:为补偿系统误差⽽与未修正测量结果相乘的数字因⼦。效应修正被定义为暴露因素在各层中与疾病的联系强度(测量的效应)因第三变量的存在情况不同⽽⼤⼩不同）

一、随机和非随机研究中的因果推断（1）--随机实验

1、随机实验：提出倾向得分这个名词，对倾向得分进行详细解释

①倾向评分是个体i被分配到治疗t的概率——用PSi=P（Xi=t）表示。

②倾向得分在X=c或X=t的个体中相等的假设比可交换性假设强，因为倾向得分的决定因素不一定影响结果Y

③如果个体在治疗之间是可交换的，并且没有其他偏差，则可以直接估计因果效应，最简单的方法是用X=c和X=t之间的Y平均值的差异

④PSi = g(zi)函数下可以忽略x的影响称为强忽略性

⑤在给定倾向得分的情况下，可以证明 X 和 Zare 条件独立；也就是说，倾向得分 PS 总

结了 Z 关于组分配中包含的所有信息

⑥倾向性得分的问题在于，它足以控制，但不是最低限度的充分（它可能包括不必要的信息，因为与Y相关但与X无关的协变量）

2、对该部分进行详细讲述：

该部分首先对交换性假设再次做出了说明：如果个体在治疗之间是可交换的，并且没有其他偏差，则可以直接估计因果效应，最简单的方法是用X=c和X=t之间的Y平均值的差异。进而引出倾向得分这个名词：倾向评分是个体i被分配到治疗t的概率——用PSi=P（Xi=t）表示。将倾向得分和交换性假设做出对比，得出结论：倾向得分在X=c或X=t的个体中相等的假设比可交换性假设强，因为倾向得分的决定因素不一定影响结果Y。通过例子：“将个体分配给每个治疗，概率为50%：PSi=1/2”说明简单的随机实验中，所有个体的PSi都相等（即倾向得分）都相同。接下来提出协变量的重要性，协变量向量Zinto纳入组分配（块设计）。通过假设这些协变量也是结果的因素，考虑它们通常会提高因果效应估计的统计精度，进而提出强忽略性的定义：PSi = g(zi)函数下可以忽略x的影响称为强忽略性。接下来文章该部分对倾向得分再次进行了深刻说明：在给定倾向得分的情况下，可以证明 X 和 Zare 条件独立；也就是说，倾向得分 PS 总结了 Z 关于组分配中包含的所有信息。通过假设如果实体根据倾向得分成对匹配，如果它们与反向倾向得分成比例加权，或者如果倾向得分在适当的回归模型中进行调整，则可以近似估计X对Y的平均影响，而不会因分配而产生偏差。文章最后提出了贝叶斯的理解：“倾向得分的估计是在Z=z下预测暴露分配（X=t）的后验概率”(先验概率（prior probability）：指根据以往经验和分析。在实验或采样前就可以得到的概率。

后验概率（posterior probability）：指某件事已经发生，想要计算这件事发生的原因是由某个因素引起的概率。

可以看出，先验概率就是事先可估计的概率分布，而后验概率类似贝叶斯公式“由果溯因”的思想。)也提出了倾向得分的问题：倾向性得分的问题在于，它足以控制，但不是最低限度的充分（它可能包括不必要的信息，因为与Y相关但与X无关的协变量）

（2）不完善的实验

1、不完善的实验：阐述了有关实验过程不是完全理想状态下的情况，对这种不完善的实验进行了解释

①不完美的实验构成了理想顺应性实验和观察研究之间的桥梁

2、对该部分进行详细讲述：

文章该部分首先对我们所做的实验给出了一定的标准假设治疗和控制方案得到了严格遵守，从这个意义上来说，我们的实验就是完善的。接下来从实际的情况进行说明,实际的治疗和控制条件并不等于预期的方案，从这个方面来说我们的实验就是不够完美的，并对此进行举例说明“在使用抗抑郁药物治疗抑郁症的过程中，人们经常面临这样一个问题，即抗抑郁治疗组（X=t）中的许多人停止服药，因为在开始时，他们只会经历不良反应”但是不完美的实验才构成了理想顺应性实验和观察研究之间的桥梁。

（3）工具变量（辅助变量）

1、工具变量（辅助变量）：通过意向治疗分析，提出工具变量这个名词，对工具变量做出了许多的说明。

①如果忽略了治疗条件没有完全遵循这一事实，则可以估计预期治疗的效果，而不是实际治疗的效果。这被称为意向治疗分析。

②工具变量I是与实际治疗或暴露X相关的变量，但仅通过其与X的关联与结果Y相关。可能工具变量最重要的例子是预期治疗

③I和X之间的关联必须是已知的或可估计的，I和X之间的差异必须独立于其他变量

2、对该部分进行详细讲述：

文章该部分首先对上文的完善实验提出了相反的假设，提出了意向治疗分析的概念：如果忽略了治疗条件没有完全遵循这一事实，则可以估计预期治疗的效果，而不是实际治疗的效果。又映射出了工具变量：工具变量I是与实际治疗或暴露X相关的变量，但仅通过其与X的关联与结果Y相关。可能工具变量最重要的例子是预期治疗。使用条件1：当观察到的X-Y关联比I-X和I-Y关联更混乱时，这些方法很有用----在特定条件下，根据具体问题的不同，可以根据I-X和I-Y关联计算X-Y关联或其边界。使用条件2：工具变量方法适用的另一种情况是，不能直接观察到X，而只能直接观察到其替代物I。对工具变量的使用做出了以下总结：I和X之间的关联必须是已知的或可估计的，I和X之间的差异必须独立于其他变量。

（4）观察性研究

1、观察性研究：提出观察性研究的概念，对倾向得分做出了进一步的说明，提出了医学中的混杂

①并不是每个有趣的因素都能转化为等效的实验室设置或被操纵，在这种情况下，别无选择，只能进行观察研究

②在观察性研究中，分组既不是操纵的，也不是随机的。

③倾向得分通常取决于各种变量（表示为向量Z）

④在实践中，无法确定某一变量是否为混杂因素，因为这取决于所有（其他）混杂因素和偏差

2、对该部分进行详细讲述：

文章该部分通过无法进行完美的理想实验，提出了观察性研究：并不是每个有趣的因素都能转化为等效的实验室设置或被操纵，在这种情况下，别无选择，只能进行观察研究。观察性研究的特点：在观察性研究中，分组既不是操纵的，也不是随机的。通过吸烟等一些无法直接强加于个体上的特征的例子，证明了我们为什么要使用观察性研究？又对上文中提出倾向得分进行了说明：倾向得分通常取决于各种变量（表示为向量Z），进一步引出了医学中混杂的相关概念，下部分基本都是围绕混杂，混杂因素来进行说明（医学中什么是混杂因素？：在临床研究中，常常存在一些因素（非研究因素)，它们与研究因素和研究结局之间存在一定的关联，会使研究真正的因果关系受到影响。这些非研究因素就是我们所谓的“混杂因素”。混杂因素应同时满足下列两个条件:(1)该因素影响研究的阳性结果(如阻止或促进){2)该因素在对比组(暴露组和非暴露组)中的分布不同。）（混杂因素的控制方法:首先，开展随机对照试验通过随机分组就可避免混杂因素的影响。然而，随机对照试验无法代替其他研究策略。那么如何避免观察性研究中的混杂因素呢?令我们感到庆幸的是，统计学方法就能帮助我们在资料分析时消除混杂因素的影响。常用于控制混杂因素的方法有Mantal-Haenszel法和多元回归分析等。临床医生要充分重视混杂因素的存在，并在研究之前充分考虑各种可能存在的混杂因素。否则一旦出现疏忽，即使在资料分析时再好的统计学家使用再好的统计学软件也无法弥补这些过失）

在许多实际情况下，由于暴露X的未观察到的决定因素，应假设存在大量的残余偏差，这反过来会影响Y。这种偏差称为混淆。混杂因子是一个与X和Y都相关且在X之前的变量；并对其进行调整，减少了X对Y因果效应估计中的总体偏差。在实践中，无法确定某一变量是否为混杂因素，因为这取决于所有（其他）混杂因素和偏差。

（5）调整未观察到的混杂和其他偏差的方法

1、调整未观察到的混杂和其他偏差的方法：敏感性分析，敏感性分析和贝叶斯方法优于传统分析，对传统分析的缺点做出剖析

①敏感性分析，它检查一个或多个假设的偏差情景会对手头的结果产生什么影响

②敏感性分析的问题在于，只有未知偏差参数的不同规定值下的预期结果范围才被揭示

③敏感性分析和贝叶斯方法优于传统分析，后者通常会产生过度自信和有偏差的结果，因为它们基于确定偏差的参数处零的错误点先验

④在传统的分析中，左边界离零点越远，偏差和外部变化的空间就越大

⑤在完全随机实验中也必须量化关联度，并报告区间估计

2、对该部分进行详细讲述：

文章该部分首先提出了，敏感性分析：它检查一个或多个假设的偏差情景会对手头的结果产生什么影响--来解决上文中提到的混杂和偏差因素，结果取决于偏差参数的假设值。敏感性分析的问题在于，只有未知偏差参数的不同规定值下的预期结果范围才被揭示。为了解决这个问题，引出了Monte Carlo灵敏度分析：分布被分配给未知偏差参数，这些参数反映了研究人员对其真实值的知识或假设，这种方法具备贝叶斯解释：因果效应的估计具有近似的有效性，并且数据不提供关于偏差参数的信息最后对比了三种分析方法： Monte Carlo灵敏度分析和贝叶斯方法优于传统分析，后者通常会产生过度自信和有偏差的结果，因为它们基于确定偏差的参数处零的错误点先验（例如误分类概率）。只要所做的假设没有根本错误（例如，向下而不是向上),这是正确的。对于传统分析：左边界离零点越远，偏差和外部变化的空间就越大统计上的显著差异并不意味着发现的关联性强到足以引起临床或政策关注；缺乏统计上显著的关联通常甚至不排除强关联----在完全随机实验中也必须量化关联度，并报告区间估计

一、一些更特殊的问题（时变曝光）--（1）

1、时变曝光（随时间变化的处理值）：暴露水平的变化对应的一系列措施，时变系统，相关的统计模型

①暴露水平X不是一个恒定条件，而是一系列治疗水平（一般或g治疗），在个体内随时间变化

②在医学研究中，暴露水平通常随时间变化

③时变系统的问题在于，它们受到反馈机制的影响

④时间依赖性暴露因果效应的统计推断通常基于生存时间作为结果，因此基于生存模型

⑤这些模型仅对治疗水平之间的差异形式进行假设，而不是对相同治疗（和协变量）水平内的结果分布形状进行假设。

2、对该部分进行详细讲述：

文章该部分提出了一个问题在随时间变化的情况下，暴露水平会产生变化吗？--随时间变化的暴露水平X不是一个恒定条件，而是一系列治疗水平（一般或g治疗），在个体内随时间变化。通过例子“Robins等人研究了预防性治疗卡氏肺孢子虫肺炎（PCP，艾滋病的一种机会性感染患者）在一项非对照研究中的生存时间的效果”说明了在医学研究中，暴露水平通常随时间变化----“因为身体并发症需要改变治疗，或者因为个人因不良影响而储存药物摄入量”。随后关于时变系统也进行了说明--时变系统的问题在于，它们受到反馈机制的影响（简单点来说：固定时间q的原因可能不仅受时间q之前发生的结果的原因（混淆）的影响，还可能影响后来的时间相关原因---时间q-1的结果可能是时间q的结果的中介因素，但却是时间q的暴露的混杂因素）对时间依赖的暴露的因果效应的统计推断通常是基于生存时间作为结果---基于生存模型。对于生存模型文章中讲述我们需要考虑到的问题很多，这些问题包括测量和未测量的混杂因素调整、反馈机制和审查（不是所有个体在整个调查时间内被观察）----他们仍然有观察研究中传统方法的所有局限性。【文章该部分最后提出了Robins导出了一种通用的递归g计算算法，并由此导出了非参数测试。然而，这些测试对简单的零假设测试更复杂的推理来说是不切实际的(就是对特别复杂的推理是不切实际的！)后来，发展了更灵活的生存结果半参数模型（称为g估计）边际结构模型”和“治疗加权估计的逆概率”提供了另一种方法。在截尾的情况下，这些方法比g估计更简单，但需要更强的假设.然而，它们通常允许改善混淆调整。Gill和Robins开发了连续时间g估计的扩展.】。

递归g计算算法---->生存结果半参数模型（称为g估计）------->“边际结构模型”和“治疗加权估计的逆概率”-------->连续时间g估计的扩展

（2）竞争风险

1、竞争风险：通过大段例子证明2个结论

①方法的影响应该由使结果消除的行动来判定，而不是由消除的结果来判定

②不存在独立于个人暴露前的历史的单一干预

2、对该部分进行详细讲述：

简而言之，就两句话：1、通过劝说方式预防肺癌也会使其他竟争风险大大降低从而增长寿命． 2、对于化疗方式而言其竞争风险不会降低，其寿命也不会大大增长

方法的影响应该由使结果消除的行动来判定，而不是由消除的结果来判定。

不存在独立于个人暴露前的历史的单一干预

（流⾏病学中的“暴露”，是指：接触过某种物质、具备某种特征或处于某种状态（如被治疗）。那么暴露⼈

群，可以理解具有某种共同经历或特征的⼈群，某种意义上可指接触⼈群。

暴露因素：定义各种能影响⼈群健康的物理、化学和⽣物因素）

（3）因果关系的概率

1、因果关系的概率：因果关系概率的概念，促成原因，RF——通常称为“可归因分数”，病因学分数（EF），将比率分数RF与因果概率混淆

①一个常见的问题是如何确定一个人的事件是由某种暴露引起的概率，也就是因果关系的概率（PC）。

②法院将因果关系定义为一种暴露，如果没有这种暴露，结果事件将a）根本不会发生，或b）以后发生

③个体因果关系概率估计的经验基础是暴露个体样本

④

⑤

2、对该部分进行详细讲述：

文章该部分讲述了因果关系的概率问题，一个常见的问题是如何确定一个人的事件是由某种暴露引起的概率，也就是因果关系的概率（PC）。法院将因果关系定义为一种暴露，如果没有这种暴露，结果事件将a）根本不会发生，或b）以后发生。这种原因被称为贡献原因[49]。个体因果关系概率估计的经验基础是暴露个体样本-----该样本应与受调查个体的暴露史和（其他）疾病风险因素相似。提出了可归因分数（RF）这个名词：暴露导致的超额发病率——相对于暴露的发病率

病因学分数（EF）：暴露于疾病中的个体的分数，其中暴露是疾病的促成原因（如果从目标人群中随机抽取个体，则个体的致病概率等于病因分数（PC=EF））。

但是比率分数RF与因果概率是不能够等价的，用公式来区分：

接下来该部分又提出了一个概念：如果暴露对被暴露者产生影响的概率很低，比率分数RF大约等于A2/AT--一个被称为超额比率的数量（因此，在这种情况下，方程PC=RF仅在A1与A2相比较小时近似成立---这意味着，该效应需要在绝大多数暴露的和患病的个体中具有全有或全无的效果。和疾病的个体中产生全或无的影响。否则，因果关系的概率因果关系的概率就会被低估，其比例为 A1/A2。）估计 PC 的⼀个基本问题是估计 A1 的数量，即在未接触的情况下以后会患上这种疾病的接触者和患病者的数量。（简单点说就是在一开始末治疗的前提下患病的治疗者和患病者的数量）。

该部分提出了一些人的观点和方法：Robins and Greenland提供了与数据一致的因果关系概率的上限和下限。Pearl表明，在哪些条件下，可以分别从数据中估算某个因素是必要原因或充分原因的概率。

一、因果推理的相关方法（1）充分-成分-原因模式

1、充分成分原因模型：Rothman提出了一种因果效应模型

①该模型类似于反事实模型，但比充分成分原因模型更精细

②该模型中的实体不是个体，而是因果机制

③充分的组件原因模型对于概念而非推理考虑非常重要

④联合足以诱发二元结果事件的因素组合

⑤对于固定时间的固定个体，通常有几个机制符合相同的反事实效应

2、对该部分进行详细讲述：

文章该部分讲述了充分成因模型的提出、优点和使用范围和条件，充分成因模型：该模型类似于反事实模型，但比充分成分原因模型更精细。模型中的实体不是个体，而是因果机制。一种机制被定义为联合足以诱发二元结果事件的因素组合，Y=1。通过例子“饮用受污染的水不足以感染霍乱；还需要其他因素”总结出了每一种可能的机制都必须至少足够：省略一个因素将Y从1变为0。也就是说，结果事件将不再存在。对该例的说明--如果饮用受污染的水是导致霍乱的各种机制的一部分，则这构成了霍乱的必要因素。又推导出了一个结论：对于固定时间的固定个体，通常有几个机制符合相同的反事实效应。最后讲述了罗斯曼的意图是在形而上学反思和流行病学研究之间建立一座桥梁。（所谓“形⽽上学”，是指唯⼼主义凭个⼈的主观愿望来定论事物的对错．

形⽽上学是指分析事物发展的唯⼼主义者。所谓“理想主义”，就是凭空对事物进⾏分析或凭⾃⼰的主观来定论事物的是⾮）

（2）结构方程模型

1、结构方程模型：

①具有潜在变量的结构方程模型（SEM）经常用于因果建模

②某些非参数SEM在逻辑上等同于反事实模型

③模型有助于构建和减少方差

④在一个未确定的方程组中需要几个假设来识别参数，然而对于假设中的不确定性无法建模

⑤这些模型的系数有时不能解释为条件依赖的度量（即回归系数）

⑥潜在变量的含义有时仍然模糊不清

2、对该部分进行详细讲述：

文章该部分对结构方程模型进行了总结和概括提出了其模型存在的三个问题和意义。首先提出了结构方程模型的使用范围：具有潜在变量的结构方程模型（SEMs）经常用于因果建模。接着说了模型包括的三个方面：这些模型包括（a）潜在变量之间关系的参数，（b）潜在变量和观测变量之间关系参数，以及（c）方程中误差项的分布参数。点出Pearl证明了某些非参数SEM在逻辑上等同于反事实模型，并证明了它们如何被视为系统中干预的“语言”。通过例子“如果假设问卷中的几个项目代表一个共同维度，则可以减少测量误差”---对这些模型有助于构建和减少方差进行证明。又对结构方程模型进行分析提出了这些模型存在的三个问题：①在一个未确定的方程组中需要几个假设来识别参数，然而对于假设中的不确定性无法建模②这些模型的系数有时不能解释为条件依赖的度量（即回归系数）③潜在变量的含义有时仍然模糊不清

”Dawid文章中关于反事实因果关系的争论”--该部分主要讲述了几个人物的各自观点

①Dawid ：

第一：认为反事实是某种形而上学的东西，因为基于反事实的因果推理将取决于不可观察的假设

第二：观察性研究中的概率因果推理（戴维是其中的倡导者）

第三：它不⾜以解决因果推理的基本问题

②Cox：指责 Dawid 提出的问题过于笼统，而且他的结论走得太远：因果效应的证明不需要了解其机制

③Shafer ：对大卫在谴责反事实方面过于温和感到遗憾

④Robins and Greenland：戴维在很大程度上忽视了观察性研究和不完善的实验的观点。

⑤Rubin：认为对 Yc 和 Yt 的联合分布建模并不总是必要的

⑥Casella and Schwarz：每项科学研究都必须针对不同的个体进行汇总

⑦Pearl and Cox：与 Dawid 的主张相反，反事实因果关系的几个方面至少是可以间接检验的

⑧Wasserman：参数的可识别性在因果模型中是必不可少的，但反事实提供了一个非常有用的概念

文章的最后：

我没有那么宏大的理想通过做研究去探求世界的本质，我只想通过自己的努力得到相对正确合理的解释！！

猿创征文｜基于反事实的因果推理Causal inference based on counterfactuals--一万六千字文献详细解读（因果关系的推理应用）【全文总结】

前言：

文章框架：

一、研究背景意义：

二、文章中运用到的公式及其符号：

三、对文章的详细剖析：

一、因果效应的反事实模型

（2）反事实和潜在结果

（3）因果效应的定义

（4）选择参考治疗方法

（5）多重因果因素和因果机制

二、反事实的统计推断

（2）平均因果效应

（3）稳定个体的治疗假设

（4）可交换性

一、因果效应的异质性

（2）效果度量的选择

（三）确定性与概率因果关系

一、随机和非随机研究中的因果推断（1）--随机实验

（2）不完善的实验

（3）工具变量（辅助变量）

（4）观察性研究

（5）调整未观察到的混杂和其他偏差的方法

一、一些更特殊的问题（时变曝光）--（1）

（2）竞争风险

（3）因果关系的概率

一、因果推理的相关方法（1）充分-成分-原因模式

（2）结构方程模型

”Dawid文章中关于反事实因果关系的争论”--该部分主要讲述了几个人物的各自观点

相关推荐