因果推断综述-A Survey on Causal Inference

发布时间：2024-05-12 13:01

最近读到一篇讲述很全面的综述文献-《A Survey on Causal Inference》，对于接触因果推断不久的同学而言是特别详细的介绍和科普。文献很长，我会分成几部分介绍。

摘要

第一部分：简介

第二部分：因果推断基础知识

第三部分：基于三种假设的因果推断方法

第四部分：实验

第五部分：应用

摘要

几十年来，因果推理是一个跨许多领域的关键研究主题，如统计、计算机科学、教育、公共政策和经济学。与随机对照试验相比，研究方向由于可用数据量大且预算要求低，如今，从观测数据中估计因果效应已成为一种吸引人的方法。与迅速发展的机器学习领域相结合，各种从观测数据中估计因果效应的方法如雨后春笋般涌现。

文章在著名的因果推理框架-潜在因果框架下全面的回顾了因果推理方法。根据是否需要潜在因果框架下的三个假设，分为两类。

对于每一个类别,都和传统的统计方法和近年来的机器学习方法进行了讨论和比较。文章还介绍了这些方法的合理应用，包括在广告、推荐、医药等方面的应用。

此外，还总结了常用的基准数据集和开源代码，方便研究者和实践者探索、评价和应用因果推理方法。

第一部分：简介

在日常语言中，相关性和因果关系通常可以互换使用，尽管它们有不同的解释。相关表示一种一般关系:当两个变量呈现增加或减少趋势时，它们是相关的。因果关系也被称为原因和结果，原因部分地导致结果，而结果部分地依赖于原因。

因果推理是根据某一结果发生的条件对某一因果关系作出结论的过程。因果推理与关联推理的主要区别在于前者分析的是当原因发生变化时，结果变量的响应。

众所周知，“相关性并不意味着因果关系。”例如，一项研究表明，通常吃早餐的女孩比不吃早餐的女孩体重轻，从而得出吃早餐有助于减肥的结论。

但事实上，这两件事可能只是有关联，而不是因果关系。也许每天吃早餐的女孩有更好的生活方式，比如经常锻炼，有规律的睡眠，还有健康的饮食，最终让她们变得更轻。

在这种情况下，拥有更好的生活方式是吃早餐和减肥的共同原因，因此我们也可以把它看作是吃早餐和减肥之间因果关系的混淆物。

在许多情况下，一种行为显然会引起另一种行为;然而，也有很多情况是我们很难梳理和确定的关系。因此，学习因果关系是一个具有挑战性的问题。

推断因果关系最有效的方法是进行随机对照试验，将参与者随机分配到治疗组或对照组。在进行随机化研究时，控制组和治疗组之间唯一的预期差异是所研究的结果变量。

然而，在现实中，随机对照试验总是耗时和昂贵的，因此，研究不能涉及很多对象，这可能不能代表治疗/干预最终的目标人群。

另一个问题是，随机对照试验只关注样本的平均值，并不能解释其机制或适用于个体受试者。

此外,在大多数随机对照试验中也需要考虑伦理问题，这在很大程度上限制了它的应用。因此，相比随机对照试验，观察数据是一个诱人的捷径。

观察数据是由研究人员在没有任何干扰的情况下简单地观察受试者而获得的。这意味着，研究人员无法控制治疗方法和研究对象，他们只是观察研究对象，并根据他们的观察记录数据。从观测数据中，我们可以发现他们的行为、结果和关于发生了什么事情的信息，但不能找出他们为什么采取特定行动的机制。

对于观测数据，核心问题是如何得到反事实的结果。例如，我们想回答这个问题“如果这个病人接受了不同的药物治疗，他会有不同的结果吗?”回答这样的反事实问题是具有挑战性的，原因有两个:

第一，我们只观察事实结果，而不会观察如果他们选择不同的治疗方案可能会发生的反事实结果。

第二个是治疗通常不是随机分配的观察性数据，这可能导致治疗人群与一般人群显著不同。

为了解决从观察数据中进行因果推理的这些问题，研究人员开发了各种框架，包括潜在结果框架和结构因果模型。潜在结果框架也被称为内曼-鲁宾潜在结果或鲁宾因果模型。

在我们上面提到的例子中，一个女孩如果每天正常吃早餐，她的体重会是特定的，而如果她不正常吃早餐，她的体重会是不同的。来衡量一个女孩正常吃早餐的因果关系，我们需要比较同一个人在两种情况下的结果。显然，同时看到这两种潜在结果是不可能的，其中一种潜在结果总是丢失。潜在结果框架旨在评估这些潜在结果，然后计算治疗效果。

因此，治疗效果估计是潜在结果框架下因果推理的核心问题之一。

因果推理中另一个有影响力的框架是结构推理因果模型(SCM)，它包括因果图和结构方程。

结构因果模型描述了一个系统的因果机制，其中一组变量和它们之间的因果关系是由一组联立的结构方程建模的。

因果推理与机器学习领域有着密切的关系。

近年来，机器学习领域的蓬勃发展促进了因果推理领域的发展。强大的机器学习方法，如决策树，集成方法，深度神经网络，用于更准确地估计潜在的结果。

除了对结果估计模型的改进外，机器学习方法也为处理混杂因素提供了一个新的方面。受益于最近的深度代表性学习方法，如生成对抗神经网络，混杂变量是通过学习所有协变量的平衡表示调整，因此，条件的学习表示，处理分配是独立于混杂变量。在机器学习中，数据越多越好。

然而，在因果推理中，仅靠更多的数据是不够的。拥有更多的数据只能帮助得到更精确的估计，但它不能确保这些估计是正确和公正的。机器学习方法促进了因果推理的发展，同时因果推理也帮助了机器学习方法。单纯追求预测精度对于现代机器学习研究来说是不够的，正确性和可解释性也是机器学习方法的目标。因果推理开始起作用改进机器学习，如推荐系统或强化学习。

在这篇文章中，提供了一个在潜在结果框架下的因果推理方法的全面介绍。

首先介绍潜在结果框架的基本概念以及来识别因果效应的三个关键假设。
之后，各种因果推理方法都有详细讨论这三种假设，包括重新加权方法、分层方法、基于匹配的方法、基于树的方法、基于表示的方法、基于多任务学习的方法和元学习方法。
此外，还介绍了释放上述三个假设的因果估计方法，以满足不同情况下的需求。
在介绍了各种因果效应估计方法之后，以广告区域、推荐区域、医药区域和强化学习区域为代表，讨论了这些方法在现实世界中应用的例子。

据作者介绍，这是第一篇在潜在结果框架下对因果推理方法进行全面讲述的论文。也有一些综述讨论了一类因果效应估计方法，如基于匹配方法的综述，基于树和基于集合的方法的综述，以及动态处理机制的回顾。对于结构因果模型，建议参考综述或书。本文也将简要讨论两个因果关系框架之间的关系和区别。还有一项关于从观察数据学习因果关系的文献，其内容包括从观察数据推断因果图、结构因果模型、潜在结果框架以及它们与机器学习的联系。

与上述文献相比，本文主要关注潜在结果框架的理论背景、统计领域和机器学习领域的代表性方法以及该框架与机器学习领域如何相互增强。

综上所述，此次综述的贡献如下:

新分类法: 根据是否需要潜在结果框架的三个假设，将各种因果推理方法分为两大类。根据处理混杂变量的方法，将需要三个假设的类别进一步分为七个子类别。
全面回顾:提供了一个在潜在结果框架下的因果推理方法的全面综述。在每一类中，对代表性的方法进行了详细的描述，并对两种方法进行了联系和比较，最后给出了总体的总结。
丰富的资源:在这个综述中，列出了最先进的方法、基准数据集、开源代码和代表性的应用程序。

本文的其余部分组织如下。

在第2节中，介绍了潜在结果框架的背景，包括基本定义、假设和基本问题及其一般解决方案。

第3节给出了在三种假设条件下的计算方法。

然后，在第4节，我们讨论了一些假设不满足时的问题，并描述了释放这些假设的方法。

接下来，我们在第5节提供实验指南。

随后，在第6节中，因果推理的典型应用将被说明。

最后，第7节对全文进行了总结。

因果推断综述-A Survey on Causal Inference

最近读到一篇讲述很全面的综述文献-《A Survey on Causal Inference》，对于接触因果推断不久的同学而言是特别详细的介绍和科普。文献很长，我会分成几部分介绍。

第一部分：简介

相关推荐